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1 宇 
出 吾 


神经 网 络 是 一 种 能 适应 新 环境 的 系统 ， 它 通过 对 过 去 经 验 ( 信息 ) 的 重复 学 习 ， 而 具 
有 分 析 、 预 测 、 推 理 、 分 类 等 功能 ， 是 当今 能 够 仿效 人 类 大 脑 去 解决 复杂 问题 的 系统 ， 神 
经 网 络 是 人 工 智能 技术 领域 的 重要 方向 ， 在 自动 控制 、 信 号 处 理 、 工 业 控制 ， 以 及 模式 识 
别 等 诸多 领域 获得 了 广泛 的 应 用 。 

随 着 计算 机 技术 的 迅猛 发 展 ， 神 经 网 络 技术 与 计算 机 技术 不 断 融 合 ， 催生 了 一 系列 可 
用 于 神经 网 络 的 软件 ， 如 NeuroSolutions、NeuralSight、MATLAB 等 ， 这 些 软件 的 广泛 应 
用 ， 极 大 地 推动 了 神经 网 络 的 发 展 。 

MATLAB 已 成 为 国际 公认 的 最 优秀 的 科技 应 用 软件 ， 具 有 编程 简单 、 数 据 可 视 化 功能 
强 、 可 操作 性 强 等 特点 ， 而 且 具 备 功能 强大 、 专 业 函 数 丰富 的 神经 网 络 工具 箱 ， 是 进行 神 
经 网 络 方面 工作 必 备 的 高 效 软件 工具 。 

利用 MATLAB 的 神经 网 络 工具 箱 , 通过 任意 连接 及 合成 不 同 的 网 络 架构 以 实现 类 神经 
网 络 仿真 及 专业 化 应 用 ， 而 且 还 具有 美观 的 操作 界面 ， 可 以 快速 构建 出 相应 的 神经 网 络 ， 
便捷 地 训练 、 测 试 网 络 。 


本 书 导读 


真 工具 ， 是 首选 的 科学 计算 软件 工具 。 
了 解 MATLAB 软件 ， 掌 握 其 运算 和 绘图 两 大 功能 ， 扣 练 掌握 程序 设计 以 
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减少 烦琐 的 数学 推导 ， 重 点 介绍 实用 的 网 络 模型 、 学 习 规则 和 训练 方法 ， 以 
及 MATLAB 神经 网 络 工具 箱 的 实现 ， 并 且 提供 丰富 的 工程 应 用 实例 。 


的 应 用 ， 利 用 MATLAB 神经 网 络 工具 箱 来 解决 这 些 问 题 ， 快 速 而 便捷 。 


本 篇 通过 综合 实例 ， 将 MATLAB， 有人 工 具 条 的 人 人， 


了 详细 的 说 明 ， 非 常 便于 读者 进行 查询 和 参考 。 
通过 本 附录 ,读者 在 进行 MATLAB 神经 网 络 计算 时 能 方便 快捷 地 查询 到 


| 
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本 书 读者 


本 书 可 作为 从 事 计 算 机 、 信 息 处 理 、 控 制 、 地 球 物理 、 医 学 、 管 理 等 专业 的 本 科 生 ， 
研究 生 学 习 神经 网 络 的 辅助 教材 和 参考 书 ， 也 可 供 相应 的 工程 技术 人 员 人 参考 使 用 。 
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第 由 章 ，MATLAB 概述 


经 过 20 余年 的 补充 与 完善 以 及 多 个 版 本 的 升级 换代 ，MATLAB 已 发 展 至 R2009b 版 
本 。MATLAB 是 一 个 包含 众多 科学 、 工 程 计算 的 庞大 系统 , 是 目前 世界 上 最 流行 的 计算 软 
件 之 一 。 


_MATLAB 的 产生 与 发 展 

MATLAB 语言 的 产生 是 与 数学 计算 紧密 联系 在 一 起 的 。1980 年 ， 美 国 新 墨西哥 州 大 
学 计算 机 系 主 任 Cleve Moler 在 给 学 生 讲授 线性 代数 课程 时 ， 发 现 学 生 在 高 级 语言 编程 上 
花费 很 多 时 间 ， 于 是 着 手 编写 供 学 生 使 用 的 Fortran 子 程序 库 接口 程序 ， 他 将 这 个 接口 程 
序 取 名 为 MATLAB ( 即 Matrix Laboratory 的 前 三 个 字母 的 组 合 ， 意 为 “矩阵 实验 室 " )。 这 
个 程序 获得 了 很 大 的 成 功 ， 受 到 学 生 的 广泛 欢迎 。 

20 世纪 80 年 代 初期 ，Moler 等 一 批 数学 家 与 软件 专家 组 建 了 MathWorks 软件 开发 公 
司 ， 继 续 从 事 MATLAB 的 研究 和 开发 ，1984 年 推出 了 第 一 个 MATLAB 商业 版 本 ， 其 核 
心 是 用 C 语言 编写 的 。 而 后 ， 它 又 添加 了 丰富 多 彩 的 图 形 图 像 处 理 、 多 媒体 、 符 号 运算 ， 
以 及 与 其 他 流行 软件 的 接口 功能 ， 使 得 MATLAB 的 功能 越 来 越 强大 。 

MathWorks 公司 正式 推出 MATLAB 后 ,于 1992 年 推出 了 具有 划时代 意义 的 MATLAB 
4.0 版 本 , 之 后 陆续 推出 了 几 个 改进 和 提高 的 版 本 , 2004 年 9 月 正式 推出 MATLAB Release 
14， 即 MATLAB 7.0， 其 功能 在 原 有 的 基础 上 又 有 了 进一步 的 改进 ，2009 年 9 月 推出 了 
R2009b， 它 是 目前 MATLAB 最 新 的 版 本 。 

MATLAB 经 过 几 十 年 的 研究 与 不 断 完善 , 现 已 成 为 国际 上 最 为 流行 的 科学 计算 与 工程 
计算 软件 工具 之 一 ， 现 在 的 MATLAB 已 经 不 仅仅 是 一 个 最 初 的 “矩阵 实验 室 ” 了 ， 到 汉 
发 展 成 为 一 种 具有 广泛 应 用 前 景 、 全 新 的 计算 机 高 级 编程 语言 ， 可 以 说 它 是 “第 四 代 ” 计 
算 机 语言 。 

自 20 世纪 90 年 代 以 来 , 美国 和 欧洲 的 各 大 学 将 MATLAB 正式 列 入 研究 生 和 本 科 生 的 教 
学 计划 ，MATLAB 软件 已 成 为 数值 计算 、 数 理 统计 、 信 号 处 理 、 时 间 序 列 分 析 、 动态 系统 仿 
真 等 课程 的 基本 教学 工具 ， 成 为 学 生 必 须 掌 握 的 基本 软件 之 一 。 在 研究 单位 和 工业 界 ， 
MATLAB 也 成 为 工程 师 们 必须 掌握 的 一 种 工具 ,被 认 做 进行 高 效 研究 与 开发 的 首选 软件 工具 。 





_MATLAB 的 优势 与 特点 


MATLAB 在 学 术 界 和 工程 界 广 受 欢迎 ， 其 主要 优势 和 特点 有 如 下 几 方 面 。 
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。 友好 的 工作 平台 和 编程 环境 

MATLAB 由 一 系列 工具 组 成 ， 其 中 许多 工具 采用 的 是 图 形 用 户 界面 ， 包 括 MATLAB 
桌面 和 命令 窗口 、 历 史 命令 窗口 、 编 辑 器 和 调试 器 、 路 径 搜索 和 用 于 用 户 浏览 帮助 、 工 作 
空间 、 文 件 的 浏览 器 。 这 些 图 形 化 的 工具 方便 用 户 使 用 MATLAB 的 函数 和 文件 。 

随 着 MATLAB 的 商业 化 以 及 软件 本 身 的 不 断 升 级 ，MATLAB 的 用 户 界面 也 越 来 越 精 
致 ， 更 加 接近 Windows 的 标准 界面 ， 人 机 交互 性 更 强 ， 操作 更 简单 。 

同时 ，MATLAB 提供 了 完整 的 联机 查询 、 帮 助 系统 ， 极 大 地 方便 了 用 户 的 使 用 。 

MATLAB 简单 的 编程 环境 提供 了 比较 完备 的 调试 系统 ,程序 不 必 经 过 编译 就 可 以 直接 
运行 ， 而 且 能 够 及 时 地 报告 出 现 的 错误 并 进行 出 错 原因 分 析 。 

。 简单 易 用 的 编程 语言 

MATLAB 语言 是 一 种 高 级 的 矩阵 语言 ， 它 包含 控制 语句 、 函 数 、 数 据 结构 、 输入 和 输 
出 ， 具 有 面向 对 象 编程 的 特点 。 用 户 可 以 在 命令 窗口 中 将 输入 语句 与 执行 命令 同步 ， 也 可 
以 先 编写 好 一 个 较 大 的 复杂 应 用 程序 ( M 文件 ) 后 再 一 起 运行 。 

MATLAB 语言 是 基于 流行 的 C++ 语言 的 ， 因 此 语法 特征 与 C++ 语言 极为 相似 ， 而 且 
更 加 简单 ， 更 加 符合 科技 人 员 对 数学 表达 式 的 书写 格式 ， 更 利于 非 计 算 机 专业 的 科技 人 员 
使 用 。 而 且 这 种 语言 可 移植 性 好 、 可 拓展 性 强 ， 这 也 是 MATLAB 能 够 深入 到 科学 研究 及 
工程 计算 各 个 领域 的 重要 原因 。 

。 强大 的 科学 计算 数据 处 理 能 力 

MATLAB 是 一 个 包含 大 量 计算 算法 的 集合 ,其 拥有 600 多 个 工程 中 要 用 到 的 数学 运算 
函数 ， 可 以 方便 地 实现 用 户 所 需 的 各 种 计算 功能 。 

函数 所 能 解决 的 问题 大 臻 包括 矩阵 运算 和 线性 方程 组 的 求解 、 微分 方程 及 偏 微分 方程 
的 组 的 求解 、 符 号 运算 、 傅 里 叶 变换 ， 数 据 的 统计 分 析 、 工 程 中 的 优化 问题 、 稀疏 矩阵 运 
算 、 复 数 的 各 种 运算 、 三 角 函 数 和 其 他 初等 数学 运算 、 多 维 数组 操作 ， 以 及 建 模 动态 仿真 
等 。 函 数 中 所 使 用 的 算法 都 是 科研 和 工程 计算 中 的 最 新 研究 成 果 ， 而 且 经 过 了 各 种 优化 和 
容错 处 理 。 

在 通常 情况 下 ， 可 以 用 MATLAB 来 代替 底层 编程 语言 ， 如 C 和 C++。 在 计算 要 求 相 
同 的 情况 下 ， 使 用 MATLAB 的 编程 工作 量 会 大 大 减少 。 

e。 出 色 的 图 形 处 理 功能 

MATLAB 自 产生 之 日 起 就 具有 方便 的 数据 可 视 化 功能 ,能 够 将 向 量 和 和 矩阵 用 图 形 的 形 
式 表现 出 来 ， 并 且 可 以 对 图 形 进行 标注 和 打印 。 

MATLAB 的 高 层次 的 作 图 功能 包括 二 维和 三 维 的 可 视 化 、 图 像 处 理 、 动 画 和 表达 式 作 
图 ， 可 用 于 科学 计算 和 工程 绘图 。 

MATLAB 对 整个 图 形 处 理 功能 进行 了 很 大 的 改进 和 完善 ,使 它 不 仅 在 一 般 数 据 可 视 化 
软件 都 具有 的 功能 ( 例如 二 维 曲线 和 三 维 曲 面 的 绘制 和 处 理 等 ) 方面 更 加 完善 ， 而 且 对 于 
一 些 其 他 软件 所 没有 的 功能 ( 例如 图 形 的 光照 处 理 、 色 度 处 理 ， 以 及 四 维 数 据 的 表现 等 )， 
MATLAB 同样 表现 出 色 。 

对 一 些 特殊 的 可 视 化 要 求 ， 例如 图 形 对 话 等 , MATLAB 也 有 相应 的 功能 函数 ， 保 证 了 
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用 户 不 同 层次 的 要 求 。MATLAB 还 在 图 形 用 户 界面 ( GUI ) 的 制作 上 作 了 很 大 的 改善 ， 对 
这 方面 有 特殊 要 求 的 用 户 也 可 以 得 到 满足 。 

。 应 用 广泛 的 模块 集合 工具 箱 

MATLAB 对 许多 专门 的 领域 都 开发 了 功能 强大 的 模块 集 和 工具 箱 ( Toolbox )。 一 般 来 
说 ， 它 们 都 是 由 特定 领域 的 专家 开发 的 ， 用 户 可 以 直接 使 用 工具 箱 学 习 、 应 用 和 评估 不 同 
的 方法 而 不 需要 自己 编写 代码 。 

目前 ,MATLAB 已 经 把 工具 箱 延 伸 到 了 科学 研究 和 工程 应 用 的 诸多 领域 ,如 神经 网 络 、 
小 波 分 析 、 优 化 算法 、 样 条 拟 合 、 概 率 统计 、 偏 微分 方程 求解 、 信 号 处 理 、 图 像 处 理 、 模 
糊 逻 辑 、 金 融 分 析 等 ， 都 在 工具 箱 家 族 中 有 了 自己 的 一 席 之 地 。 

e。 实用 的 程序 接口 和 发 布 平台 

MATLAB 可 以 利用 MATLAB 编译 器 和 C/C++ 数 学 库 和 图 形 库 ， 将 自己 的 MATLAB 
程序 自动 转换 为 独立 于 MATLAB 运行 的 C 和 C++ 代码 ， 允 许 用 户 编写 可 以 和 MATLAB 
进行 交互 的 C 或 C++ 语言 程序 。 另 外 ，MATLAB 网 页 服务 程序 还 容许 在 Web 应 用 中 使 用 
自己 的 MATLAB 数学 和 图 形 程序 。 





MATLAB 系统 由 MATLAB 开发 环境 .MATLAB 数学 函数 库 .MATLAB 语言 .MATLAB 
图 形 处 理 系 统 和 MATLAB 应 用 程序 接口 ( API ) 五 大 部 分 构成 。 

e。 MATLAB 开发 环境 

这 部 分 是 一 套 方便 用 户 使 用 MATLAB 函数 和 文件 的 工具 集 , 其 中 许多 工具 是 友好 的 、 
交互 式 的 图 形 化 用 户 接口 。 它 是 一 个 集成 化 的 工作 空间 ， 可 以 让 用 户 输入 、 输 出 数据 ， 并 
提供 了 M 文件 的 集成 编译 和 调试 环境 。 它 包括 MATLAB 桌面 、 命 令 窗口 、M 文件 编辑 调 
试 器 、 代 码 分 析 器 ( Code Analyzer 查看 帮助 、 工 作 空间 、 文 件 和 其 他 工具 的 浏览 器 。 

e。 MATLAB 数学 函数 库 

MATLAB 数学 函数 库 包括 了 大 量 的 计算 算法 ， 从 基本 运算 ( 如 加 法 、 正 弦 函 数 等 ) 到 
复杂 算法 ， 如 矩阵 求 北 、 和 矩阵 求 特 征 值 、 贝 塞 尔 函 数 、 快 速 傅 里 叶 变 换 等 。 

。。MATLAB 语言 

MATLAB 语言 是 一 个 高 级 的 基于 矩阵 /数组 的 语言 ， 它 有 程序 流 控制 、 函 数 、 数 据 结 
构 、 输 入 /输出 和 面向 对 象 编程 等 特色 。 用 户 既 可 以 用 它 来 快速 编写 简单 的 程序 ， 也 可 以 用 
它 来 编写 庞大 复杂 、 重 用 性 高 的 应 用 程序 。 

e。MATLAB 图 形 处 理 系统 

图 形 处 理 系统 使 得 MATLAB 能 方便 地 图 形 化 显示 向 量 和 和 矩阵， 而 且 能 对 图 形 添加 标 
注 和 打印 。MATLAB 提供 两 个 层次 的 绘图 操作 ， 一 种 是 对 图 形 句柄 进行 的 底层 绘图 操作 ， 
另 一 种 是 建立 在 底层 绘图 操作 之 上 的 高 层 绘图 操作 。 

。 MATLAB 应 用 程序 接口 

MATLAB 应 用 程序 接口 是 一 个 使 MATLAB 与 C、Fortran 等 其 他 高 级 编程 语言 进行 交 
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互 的 函数 库 ， 该 函数 库 的 函数 通过 调用 动态 连接 库 ( DLL ) 实现 与 MATLAB 文件 的 数据 
交换 ， 其 主要 功能 包括 在 MATLAB 中 调用 C 和 Fortran 程序 ， 以 及 在 MATLAB 与 其 他 应 
用 程序 间 建 立 客户 /服务 器 关系 。 


_MATLAB 桌面 操作 环境 


MATLAB 为 用 户 提供 了 全 新 的 桌面 操作 环境 ， 了 解 并 熟悉 这 些 桌 面 操作 环境 是 使 用 
MATLAB 的 基础 ， 下 面 介绍 MATLAB 的 启动 、 主 要 功能 菜单 、 命 令 窗口 ( Command 
Window 入 工作 空间 ( Workspace )、 文 件 管理 和 帮助 管理 等 。 


1.4.1 MATLAB 启动 和 退出 


以 Windows 操作 系统 为 例 , 进入 Windows 后 ， 选择 “开始 " 一 “程序 " “MATLAB 
R2008b”“， 便 可 以 进入 如 图 !-1 所 示 的 MATLAB 默认 主 窗口 。 如 果 安装 时 选择 在 桌面 上 生 
成 快捷 方式 ， 也 可 以 双击 快捷 方式 直接 启动 。 
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图 1-1 MATLAB 主 窗口 


MATLAB 主 窗 口 是 MATLAB 的 主要 工作 界面 。 主 窗口 除了 乌 入 一 些 子 窗口 外 ， 还 包 
括 菜单 栏 和 工具 栏 。 

主 窗口 的 工具 栏 共 提供 了 11 个 命令 按钮 。 这 些 命令 按钮 均 有 对 应 的 菜单 命令 ， 但 比 
菜单 命令 使 用 起 来 更 快捷 、 方 便 。 

单 击 主 窗口 左下 角 的 “Start” 按 钮 ， 会 弹出 一 个 菜单 ， 如 图 1-2 所 示 。 选 择 其 中 的 命 
令 可 以 执行 MATLAB 产品 的 各 种 工具 ， 并 且 可 以 查阅 MATLAB 包含 的 各 种 资源 。 

从 图 1-2 中 可 以 看 出 ，MATLAB 的 主要 资源 有 : 

。MATLAB 主体 : 由 MATLAB 的 编程 集成 环境 、 程 序 开发 工具 和 与 其 他 软件 的 扩展 

接口 组 成 。 
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图 1-2 “Start” 按 钮 的 弹出 菜单 


。 工具 箱 ( Toolboxes ): 是 MATLAB 函数 的 子 程序 库 ， 每 一 个 工具 箱 都 是 为 某 一 类 学 
科 专 业 和 应 用 而 定制 的 , 主要 包括 最 优化 计算 、 遗 传 算法 、 神 经 网 络 等 方面 的 应 用 。 

。Simulink: 是 MATLAB 最 重要 的 组 件 之 一 ， 它 提供 一 个 动态 系统 建 模 、 仿 真 和 综合 
分 析 的 集成 环境 。 它 是 一 种 可 视 化 仿真 工具 ， 是 一 种 基于 MATLAB 的 框图 设计 环 
境 ， 在 该 环境 中 ， 无 须 大 量 书写 程序 ， 而 只 需要 通过 简单 直观 的 鼠标 操作 ， 就 可 构 
造 出 复杂 的 系统 。Simulink 广泛 应 用 于 线性 系统 、 非 线性 系统 、 数 字 控 制 及 数字 信 
号 处 理 的 建 模 和 仿真 中 。 

。 模块 集 ( Blocksets )， 是 一 个 个 的 数学 软件 包 ， 是 系统 仿真 的 关键 部 件 。 

。 自动 代码 生成 工具 ( Links and Targets ): 将 MATLAB 中 的 Simulink 程序 框图 自动 转 
换 成 能 入 式 ANSI C 的 代码 ， 是 第 三 方 软件 和 硬件 应 用 Simulink 的 工具 。 

常用 的 退出 MATLAB 系统 的 方式 有 三 种 : 

(1 ) 在 文件 菜单 ( File ) 中 选择 “Exit MATLAB 。 

(2 ) 在 命令 窗口 输入 “exit "。 

( 3 ) 用 鼠标 单 击 窗口 右上 角 的 关闭 图 标 。 


1.4.2 MATLAB 主 菜单 及 功能 


打开 MATLAB 主 窗口 后 ， 即 弹出 其 主 菜 单 栏 ， 共 包含 File、Edit、Debug、Parallel、 
Desktop、Window 和 Help 共 7 个 菜单 项 。 主 菜单 栏 的 各 菜单 项 及 其 下 拉 菜 单 的 功能 简要 
介绍 如 下 。 


1，File 主 菜单 
File 主 菜单 实现 有 关 文件 的 操作 ， 其 下 拉 菜单 项 有 : 
(1 ) New: 用 于 建立 新 的 .m 文件 、 图 形 、 模 型 和 图 形 用 户 界面 。 
(2 ) Open， 用 于 打开 MATLAB 的 .m 文件 、.fig 文件 、-mat 文件 、.mdl 文件 、.cdr 文 
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件 等 ， 也 可 通过 快捷 键 “Ctl+O” 来 实现 此 项 操作 。 
(3 ) Close Command Window: 关闭 命令 窗口 。 
(4 ) Import Data; 用 于 从 其 他 文件 导入 数据 ， 单 击 此 菜单 项 将 弹出 对 话 框 ， 可 在 其 中 
选择 导入 文件 的 路 径 和 位 置 。 
(5 ) Save Workspace As: 用 于 把 工作 空间 的 数据 存放 到 相应 的 路 径 文件 中 。 
(6 ) Set Path， 设置 工作 路 径 。 
(7 ) Preferences， 用 于 设置 命令 窗 的 属性 ， 单 击 该 选项 弹出 一 个 属性 画面 。 
( 8 ) Page Setup， 用 于 页 面 设置 。 
(9 ) Print， 用 于 设置 打印 属性 。 
( 10 ) Print Selection， 用 于 对 选择 的 文件 数据 进行 打印 设置 。 
( 11 ) Exit MATLAB: 退出 MATLAB 桌面 操作 环境 。 


2.， Edit 主 菜 单 

Edit 主 菜单 用 于 命令 窗口 的 编辑 操作 ， 其 下 拉 菜 单项 有 : 

( 1 ) Undo:， 用 于 撤销 上 一 步 操作 。 

(2 ) Redo: 用 于 重新 执行 上 一 步 操作 。 

(3 ) Cut: 用 于 剪 切 选中 的 对 象 。 

( 4 ) Copy: 用 于 复制 选中 的 对 象 。 

(5 ) Paste， 用 于 粘贴 剪贴 板 上 的 内 容 。 

(6 ) Paste to Workspace: 用 于 打开 Import Wizard ( 输入 向 导 ) 对 话 框 ， 将 剪贴 板 上 的 
数据 粘贴 到 MATLAB 的 工作 空间 中 。 

(7 ) Select All; 用 于 全 部 选择 。 

( 8 ) Delete， 用 于 删除 所 选 的 对 象 。 

(9 ) Find， 用 于 查找 所 需 选 择 的 对 象 。 

( 10 ) Find Files: 用 于 查找 所 需 文 件 。 

(11 ) Clear Command Window， 用 于 清除 命令 窗口 区 的 对 象 。 

( 12 ) Clear Command History :用 于 清除 命令 窗口 区 的 历史 记录 。 

( 13 ) Clear Workspace: 用 于 清除 工作 区 的 对 象 。 


3. Debug 主 菜单 
用 户 可 以 通过 Debug 主 菜单 进行 程序 调试 时 的 各 种 设置 ， 其 下 拉 菜 单项 有 ， 
( 1 ) Open M-Files when Debugging:， 用 于 调试 时 打开 M 文件 。 
( 2 ) Step: 用 于 单 步调 试 程序 。 
( 3 ) Step In: 用 于 单 步调 试 进 入 子 函数 。 
(4 ) Step Out: 用 于 单 步调 试 从 子 函数 中 跳出 。 
( 5 ) Continue: 程序 执行 到 下 一 断 点 。 
(6 ) Clear Breakpoints in All Files， 清除 所 有 打开 文件 中 的 断 点 。 
(7 ) Stop 计 ErrorWarnings:， 在 程序 出 错 或 报警 处 停止 往 下 执行 。 
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( 8 ) Exit Debug Mode: 退出 调试 模式 。 
4. Parallel 主 菜单 
Parallel 主 菜 单 用 来 进行 并 行 计算 方面 的 设置 ， 其 下 拉 菜 单项 有 
(1 ) Select Configuration: 选择 并 行 计 算 的 配置 类 型 。 
(2 ) Manage Configuration: 对 配置 进行 管理 。 
(3 ) Admin Center， 打 开 并 行 计算 的 管理 中 心 。 
并 行 计 算 的 设置 比较 专业 ， 一 般 不 进行 设置 。 
5. Desktop 主 菜单 


Desktop 主 菜单 用 来 设置 主 窗口 中 需要 打开 的 窗口 ， 其 下 拉 莱 单项 有 

(1) Desktop Layout: 单 击 该 项 后 ， 弹 出 一 个 子 菜单 ;用 于 设置 桌面 显示 方式 ， 其 设 
置 选项 包括 系统 默认 设置 项 ( Default )、 单 独 命令 窗口 项 ( Command Window Only 和 命令 
历史 窗口 和 命令 窗口 项 ( History and Command Window )、 全 部 标签 项 显示 ( All Tabbed )o 

( 2 ) Save Layout: 保存 选 定 的 桌面 显示 方式 设置 。 

(3 ) Organize Layouts: 管理 保存 的 桌面 显示 方式 设置 。 

(4 ) Command Window:， 控制 在 桌面 系统 中 显示 或 隐藏 命令 窗口 。 

( 5 ) Command History， 控制 在 桌面 系统 中 显示 或 隐藏 历史 命令 窗口 。 

(6 ) Current Directory: 控制 在 桌面 系统 中 显示 或 隐藏 当前 路 径 浏览 器 窗口 。 

(7 ) Workspace: 控制 在 桌面 系统 中 显示 或 隐藏 工作 空间 窗口 。 

( 8 ) Help: 控制 在 桌面 系统 中 显示 或 隐藏 帮助 界面 。 

( 9 ) Profiler: 控制 在 桌面 系统 中 显示 或 隐藏 调试 器 界面 。 

( 10 ) Editor， 控 制 在 桌面 系统 中 显示 或 隐藏 M 文件 编辑 窗口 。 

(11 ) Figures， 控制 在 桌面 系统 中 显示 或 隐藏 图 形 窗口 。 

(12 ) Web Browser: 控制 在 桌面 系统 中 显示 或 隐藏 Web Browser 窗口 。 

( 13 ) Variable Editor， 控 制 在 桌面 系统 中 显示 或 隐藏 工作 空间 变量 编辑 窗口 。 

(14 ) File and Directory Comparisons: 控制 在 桌面 系统 中 显示 或 隐藏 文件 和 目 录 比 较 窗 
D。 

( 15 ) Toolbar， 控 制 在 桌面 系统 中 显示 或 隐藏 工具 栏 选项 。 

( 16 ) Tites: 控制 在 桌面 系统 中 显示 或 隐藏 标题 栏 选 项 。 


6. Window 主 菜单 
Window 主 菜单 能 够 在 所 打开 的 文件 或 者 窗口 中 ， 重 新 设置 它们 的 位 置 和 大 小 ， 还 可 
以 实现 它们 之 间 的 快速 切换 ， 其 下 拉 菜 单项 有 : 
(1) close AlL Documents: 关闭 所 有 文档 ， 包 括 M-file、Figure、Model 和 GUI 窗口 。 
(2 ) 0 Command Window: 选 定 命令 窗口 为 当前 活动 窗口 。 
(3 ) 1 Command History， 选 定 命令 历史 窗口 为 当前 活动 窗口 。 
(4 ) 2 Current Directory: 选 定 当前 路 径 窗口 为 当前 活动 窗口 。 
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(5 ) 3 Workspace: 选 定 工作 空间 宣 口 为 当前 活动 窗口 。 
7. Help 主 菜单 

Help 主 菜 单 用 于 提供 帮助 信息 ， 其 下 拉 菜 单项 有 : 

(1 ) Product Help: 显示 所 有 MATLAB 产品 的 帮助 信息 。 

( 2 ) Function Browser: 启动 MATLAB 帮助 。 

(3 ) Using the Desktop:， 启动 Desktop 的 帮助 。 

(4) Using the Command Window:， 启动 命令 窗口 的 帮助 。 

{5 ) Web Resources: 显示 Internet 上 一 些 相关 的 资源 网 址 。 

( 6 ) Get Product Trials， 申 请 试用 版 的 MATLAB 软件 。 

(7 ) Check for Updates: 检查 软件 是 否 更 新 。 

(8 ) Licensing: 授权 文件 的 一 些 相 关 操 作 。 

(9 ) Demos: 调用 MATLAB 所 提供 的 范例 程序 。 

( 10 ) Terms of Use， 显示 MATLAB 软件 中 使 用 的 术语 。 

(11 ) Patents， 显 示 MATLAB 软件 的 专利 信息 。 

( 12 ) About MATLAB:， 显示 有 关 MATLAB 的 信息 。 


1.4.3 MATLAB 命令 窗口 


MATLAB 的 命令 窗口 ( Command Window ) 如 图 1-3 所 示 ， 它 用 于 MATLAB 命令 的 
交互 操作 。 


Cargo 
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图 1-3 MATLAB 的 命令 窗口 


1， 命令 窗口 的 主要 功能 和 操作 
命令 窗口 具有 两 大 主要 功能 : 
( 1 ) 提供 用 户 输入 命令 的 操作 平台 ， 用 户 通过 该 窗口 输入 命令 和 数据 。 
( 2 ) 提供 命令 执行 结果 的 显示 平台 ， 该 窗口 显示 命令 执行 的 结果 。 
在 命令 窗口 内 执行 的 MATLAB 主要 操作 有 : 
。 运行 函数 和 输入 变量 。 
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。 控制 输入 和 输出 。 

。 执行 程序 ， 包 括 M 文件 和 外 部 程序 。 

。 保存 一 段 日 志 。 

e。 打开 或 关闭 其 他 应 用 窗口 。 

。 各 应 用 窗口 的 参数 选择 。 

在 计算 机 上 安装 好 MATLAB 之 后 ,双击 MATLAB 图 标 ， 就 可 以 进入 命令 窗口 ,此 时 
意味 着 系统 处 于 准备 接受 命令 的 状态 ， 可 以 在 命令 窗口 中 直接 输入 命令 语句 。 

MATLAB 语句 形式 为 : 》 变 量 = 表达 式 。 

通过 等 号 将 表达 式 的 值 赋予 变量 。 当 输入 回 车 时 ， 该 语句 被 执行 。 执 行 之 后 ， 窗 口 自 
动 显 示 出 语句 执行 的 结果 。 

使 用 方向 键 和 控制 键 可 以 编辑 、 修 改 已 输入 的 命令 ，" 1 ” 键 回 调 上 一 行 命令 ，“ |” 
键 回 调 下 一 行 命令 。 使 用 “more off" 表示 不 允许 分 页 "more on” 表示 人 允许 分 页 ，more (D)” 
表示 指定 每 页 输出 的 行 数 。 输 入 回 车 键 则 前 进 一 行 ， 输 入 空格 键 显 示 下 一 页 ， 输 入 “q 
则 结束 当前 显示 。 

如 果 命 令 语句 超过 一 行 或 者 希望 分 行 输入 ， 则 可 以 使 用 多 行 命令 分 批 输 入 。 例 如 ， 输 
入 下 列 式 子 时 ， 可 以 通过 两 行 输入 。 





+4+ 


党 也 三 个 小 黑 点 是 “ 连 行 号 ”分 号 “i ”的 作用 是 :- 指令 执行 结果 将 不 显示 在 
屏幕 上 ， 但 变量 S 将 驻 留 在 内 存 中 。 


注意 ，MATLAB R2008b 版 本 中 在 输入 符 “>>” 之 前 新 增 了 函数 浏览 器 ( Browse for 
functions ) 厌 ， 可 以 方便 地 进行 函数 查找 以 及 函数 参数 的 自动 帮助 。 


2， 命令 窗口 的 常用 命令 
MATLAB 提供 了 一 组 可 以 在 命令 窗口 中 输入 的 命令 , 以 执行 相应 的 操作 , 常用 的 命令 
及 功能 如 表 1-1 中 所 示 。 


表 1-1 命令 窗口 中 常用 的 命令 及 功能 


















































命令 功能 命令 功能 
lc 控 去 一 页 命令 窗口 ， 光 标 回 屏幕 左上 角 | pack 整理 工作 空间 内 存 
clear 清除 工作 空间 中 所 有 的 变量 size { 变量 名 ) 显示 当前 工作 空间 中 变量 的 尺寸 
clear all 从 工作 空间 清除 所 有 变量 和 函数 length { 变量 名 ) 显示 当前 工作 空间 中 变量 的 长 度 
clear 变量 名 清除 指定 的 变量 disp ( 变量 名 ) 量 示 当前 工作 空间 中 的 变量 
elf 清除 图 形 窗 口内 容 “或 “Cud+P” 调用 上 一 次 的 命令 
delete < 文件 名 > | 从 磁盘 中 删除 指定 文件 调用 下 一 行 的 命令 
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命令 
help < 命令 名 > 查询 所 列 命令 的 帮助 信息 
which < 文件 名 > | 查找 指定 文件 的 路 径 

| who 显示 当前 工作 空间 中 所 有 变量 的 一 个 简单 列表 


功能 








退 后 一 格 
前 移 一 格 
光标 移 到 行 首 







































whos 列 出 变量 的 大 小 、 数 据 格式 等 详细 信息 光标 移 到 行 尾 
what | 列 出 当前 目录 下 的 M 文件 和 mat 文件 Esc 或 “Cul+U” 清除 一 行 
| 
| load name 下 载 name 文件 中 的 所 有 变量 到 工作 空间 清除 光标 后 的 字符 
吉 









下 载 name 文件 中 的 变量 xy 到 工作 空间 清除 光标 前 的 字符 








EYE 
中 断 程序 运行 






保存 工作 空间 变量 到 文件 name.mat 中 
保存 工作 空间 变量 xy 到 文件 name.mat 中 














1.4.4 MATLAB 工作 空间 


MATLAB 的 工作 空间 如 图 1-4 所 示 。 











增加 新 变量 














打开 选 定 的 变量 将 变量 保存 为 文件 





删除 变 最 















[55004550:T, 全 
[35 





图 1-4 MATLAB 的 工作 空间 


工作 空间 中 的 变量 以 变量 名 ( Name )、 数 值 ( Value ) 和 类 型 ( Class ) 的 形式 显示 出 来 ， 
双击 某 个 变量 ， 将 进入 变量 编辑 器 ( Variable Editor )， 可 以 直接 观察 变量 中 具体 元 素 的 值 ， 
也 可 以 直接 修改 这 些 元 素 。 


1. 工作 空间 的 工具 条 
MATLAB 7 的 工作 空间 中 还 有 一 个 工具 条 ， 可 快捷 地 在 工作 空间 中 进行 许多 操作 ， 这 
些 操作 在 图 1-4 中 标注 出 来 了 ， 简 单 介绍 如 下 。 
。 辐 ( 增加 新 变量 )， 在 工作 空间 中 增加 一 个 新 的 变量 ， 并 可 对 此 变量 进行 赋值 、 修 
改 等 操作 。 
。 罩 ( 打开 选 定 的 变量 )， 将 工作 空间 中 选 定 的 变量 在 变量 编辑 器 ( Variable Editor ) 
中 打开 ， 可 对 此 变量 进行 修改 等 操作 。 
。 到 ( 导入 数据 ) 将 MATLAB 支持 格式 的 数据 导入 到 工作 空间 中 。 
。 量 ( 将 变量 保存 为 文件 )， 将 工作 空间 中 选 定 的 变量 以 文件 的 形式 保存 起 来 。 
。 痢 ( 删除 变量 )， 将 工作 空间 中 选 定 的 变量 删除 。 
。 四 上 ( 将 变量 绘制 成 图 形 ): 将 工作 空间 中 选 定 的 变量 绘制 成 图 形 ,支持 的 绘图 函数 
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有 plot、bar、stem、stairs、area、pie、hist 和 plot3 等 。 若 在 工作 空间 选择 某 变量 后 ， 
再 单 击 该 按钮 ， 便 可 实现 对 该 变量 的 曲线 、 曲 面 等 图 形 的 绘制 。 

2. 工作 空间 的 变量 编辑 器 


变量 编辑 器 ( Variable Editor ) 是 编辑 数组 变量 的 工具 ， 其 形式 有 如 Excel 电子 表格 ， 
只 是 它 仅 能 修改 及 显示 ， 没 有 计算 的 功能 。 在 工作 空间 中 选 定 变量 ， 然 后 双击 ， 便 可 进入 
如 图 1-5 所 示 的 变量 编辑 器 窗口 。 











图 1-5 变量 编辑 器 窗口 


在 编辑 器 中 ， 可 以 对 变量 进行 修改 、 删 除 、 增 加 等 操作 ， 非 常 方便 。 需 要 注意 的 是 ， 
由 于 大 型 矩阵 不 容易 由 命令 窗口 输入 ， 因 此 采用 变量 编辑 器 更 为 方便 。 变 量 编辑 器 可 与 
Excel 表格 的 数据 相通 ， 只 要 将 Excel 表格 中 的 数据 复制 ， 即 可 粘贴 到 编辑 器 中 的 某 一 变量 
内 。 原 则 上 ， 变 量 的 输入 以 行 向 为 主 ， 要 增加 一 行 ， 只 要 将 其 中 一 元 素 之 位 置 增加 即 可 ， 
如 此 即 可 增加 另 一 行 。 其 余 未 有 数据 之 空间 则 以 零 取代 。 


3. 工作 空间 相关 的 常用 命令 

MATLAB 还 有 几 个 常用 的 工作 空间 操作 的 命令 , 分 别 是 who、whos、clear、size、\length， 
其 各 自 功 能 描述 如 下 。 

。who， 显示 当前 工作 空间 中 所 有 变量 的 一 个 简单 列表 。 

e whos: 列 出 变量 的 大 小 、 数 据 格式 等 详细 信息 。 

。 clear， 清 除 工作 空间 中 的 所 有 变量 。 

。 clear 变量 名 : 清除 指定 的 变量 。 

e size(a)， 获取 向 量 a 的 行 数 与 列 数 。 

。 length(a): 获取 向 量 a 的 长 度 ， 并 在 屏幕 上 显示 。 如 果 4 是 矩阵 ， 则 显示 的 参数 为 

行 数 中 的 最 大 值 。 


4. 工作 空间 的 数据 存 取 命令 
MATLAB 提供 了 以 下 保存 ( save ) 和 载 入 (load ) 工作 空间 的 命令 。 


(1 ) save 命令 
save 命令 是 将 MATLAB 工作 空间 中 的 变量 存 入 磁盘 ， 具 体格 式 介绍 如 下 。 
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。 save: 将 当前 MATLAB 工作 空间 中 所 有 变量 以 二 进 制 格式 存 入 名 为 matlab mat ( 默 
认 的 文件 名 ) 的 文件 中 。 

。save dfile ( 文件 名 ): 将 当前 工作 空间 中 所 有 变量 以 二 进 制 格式 存 入 名 为 dfile .mat 
文件 ， 扩 展 名 自动 产生 。 

。save dfile x: 只 把 变量 x 以 二 进 制 格式 存 入 dfile.mat 文件 ， 扩 展 名 自动 产生 。 

。save dfile.dat x -ascii; 将 变量 x 以 8 位 ASCII 码 形式 存 入 dfile.mat 文件 。 

save dfile.dat x -ascii -double: 将 变量 x 以 16 位 ASCII 码 形式 存 入 dfile.mat 
文件 。 

。 save ( fname，'x'，'-ascii' )，fname 是 一 个 预先 定义 好 的 包含 文件 名 的 字符 串 ， 该 用 
法 将 变量 x 以 ASCII 码 形式 存 入 由 fname 定义 的 文件 中 ， 由 于 在 这 种 用 法 中 ,文件 
名 是 一 个 字符 变量 ， 因 此 可 以 方便 地 通过 编程 的 方法 存储 一 系列 数据 文件 。 

(2 ) load 命令 

load 命令 是 将 磁盘 上 的 数据 读 入 到 工作 空间 ， 具 体格 式 介绍 如 下 。 

。 load， 把 磁盘 文件 matlab.mat ( 默认 的 文件 名 ) 的 内 容 读 入 内 存 ， 由 于 存储 .mat 文 
件 时 已 包含 了 变量 名 的 信息 ， 因 此 调 回 时 已 直接 将 原 变量 信息 带 入， 不 需要 重新 赋 
值 变量 。 

。 load dfile， 把 磁盘 文件 dfile.mat 的 内 容 读 入 内 存 。 

eload dfile.dat， 把 磁盘 文件 dfile.mat 的 内 容 读 入 内 存 ， 这 是 一 个 ASCII 码 文件 ， 系 
统 自 动 将 文件 名 ( dfile ) 定义 为 变量 名 。 

。 x=load (fname): fname 是 一 个 预先 定义 好 的 包含 文件 名 的 字符 串 ， 将 由 fname 定义 文件 
名 的 数据 文件 读 入 变量 x 中 ， 使 用 这 种 方法 可 以 通过 编程 方便 地 调 入 一 系列 数据 文件 。 


1.4.5“M 文件 编辑 /调试 器 


将 MATLAB 语句 按 特 定 的 顺序 组 合 在 一 起 就 得 到 了 MATLAB 程序 , 其 文件 名 的 后 级 


为 ,m， 故 也 称 为 M 文件 。MATLAB 7.x 提供 了 M 文件 的 专用 编辑 /调试 器 ， 在 编辑 器 中 ， 
会 以 不 同 的 颜色 表示 不 同 的 内 容 , 命令 、 关 键 字 、 不 完整 字符 串 、 完 整 字符 串 及 其 他 文本 ， 
这 样 就 可 以 发 现 输入 错误 ， 缩 短 调试 时 间 。 


M 文件 编辑 /调试 器 如 图 1-6 所 示 。 


Cgzmgpmmcrzczzca 
让 本 | 天 二 号 P 册 避 -1 国有 中 三 天 检阅 间 二 由 考 硬 





图 1-6”M 文件 编辑 /调试 器 
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1.M 文件 编辑 器 的 特点 

MATLAB 编辑 器 与 其 他 Windows 编辑 程序 类 似 ， 此 处 只 对 下 列 几 点 作 特别 说 明 。 

(1 ) 在 编辑 M 文件 时 ， 可 直接 转 到 指定 的 行 。 方 法 为 : 从 “Go” 菜单 中 选择 “Go To” 
命令 。 

(2 ) 可 直接 计算 M 文件 中 表达 式 的 值 ， 将 结果 显示 在 命令 窗口 中 。 方 法 为 : 选择 表 
达 式 ， 然 后 在 “Text” 菜 单 中 选择 “Evalueate Selection” 命 令 。 

(3 ) 可 根据 MATLAB 的 句法 自动 缩 排 ， 以 增加 M 文件 的 可 读 性 。 方 法 为 : 先 选择 文 
本 块 ， 然 后 按 鼠 标 右键 ， 在 “Text” 菜 单 中 选择 “Smart Indent” 命 令 。 


2. 编辑 器 的 工具 栏 
下 面 只 对 此 工具 栏 中 特殊 的 按钮 进行 叙述 ， 如 表 1-2 所 示 。 





表 1-2 ”工具 栏 中 特殊 的 按钮 
按钮 功能 按钮 功能 
保持 文件 并 以 HTML 格式 发 布 也 左右 显示 M 文件 
相当 于 “Edit” 菜 单 中 的 “Find Next” 命 令 上 下 显示 M 文件 
后 退 一 步 5 浮动 M 文件 
前 进一步 备 最 大 化 M 文件 
一 
显示 函数 - 计算 数组 




















设置 /取消 指定 行 的 断 点 计算 前 面 所 有 数组 
清除 所 有 M 文件 中 的 断 点 0 指针 减 小 并 计算 数组 








逐步 执行 程 序 指针 增 大 并 计算 数组 
进入 子 函 数 中 逐步 执行 程序 属 误 上 指针 被 除 并 计算 数组 
跳出 子 函数 人 TD | 指针 被 乘 并 计算 数组 
保存 后 继续 执行 所 调试 的 程序 插入 数组 

退出 调试 状态 | 器 未 数组 标题 

打 邢 数 浏览 器 二 是 示 数组 模式 信息 
全 部 昌 示 M 文件 


























1.4.6 图形 窗 口 


MATLAB 图 形 窗口 ( Figure ) 主要 用 于 显示 用 户 所 绘制 的 图 形 。 通 常 ， 只 要 执行 了 任 
意 一 种 绘图 命令 ， 图 形 窗口 就 会 自动 产生 。 绘 图 都 在 这 一 个 图 形 窗口 中 进行 。 如 果 再 建 一 
个 图 形 窗口 ， 则 可 输入 “figure” 命 令 ，MATLAB 会 新 建 一 个 图 形 窗口 ， 并 自动 给 它 排出 
序号 。 

MATLAB 的 图 形 窗口 如 图 1.7 所 示 。 它 是 MATLAB 绘图 功能 的 基础 ， 使 用 起 来 极其 
方便 。 其 菜单 和 工具 栏 ， 更 是 增添 了 交互 处 理 的 功能 。 


1 图形 窗 口 的 菜单 栏 
图 形 窗口 的 “Desktop"( 桌面 ) 菜单 、"Window"( 窗口 ) 菜单 和 “Help”( 帮助 ) 菜 
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单 ， 与 其 他 系统 的 大 致 一 样 ， 也 比较 简单 ， 可 以 对 照 学 习 ， 在 此 不 再 叙述 。 下 面 只 对 差别 
较 大 的 菜单 项 进行 介绍 。 


abse Besktop indor glp ED 


7 困 愉 元-| 包 日 因 | 是 口 田 加 日 中 ID 








图 1-7 图 形 窗口 


(1) File 菜单 
其 主要 功能 命令 与 桌面 平台 的 File 菜单 相近 ， 只 是 增加 了 图 形 输 出 Generate M-file 命 
令 、Export Setup、Print Preview 和 Print 命令 。 
。 Generate M-file 命令 ， 生 成 当前 图 形 的 M 文件 。 
。 Export Setup 命令 : 打开 Export Setup ( 图 形 输出 设置 ) 对 话 框 。 
。 Print Preview 命令 : 打开 打印 预览 对 话 框 。 
(2) View 莱 单 
其 中 的 Figure Toolbar 命令 用 于 控制 是 否 显示 图 形 窗 口中 的 工具 栏 ,而 Camera Toolbar 
命令 用 于 控制 是 否 显示 图 形 窗口 中 的 照相 操作 工具 栏 。 
(3 ) Insert 莱 单 
通过 该 菜单 , 可 以 在 图 形 窗口 中 添加 不 同 的 对 象 , 主要 有 : X Label、Y Label、Z Label、 
Title、Legend( 图 例 ) Colorbar( 颜色 条 ) 八 Line、Arrow 、Text Arrow、Double Arrow 、TextBox、 
Rectangle、Ellipse、Axes 和 Light ( 光源 ) 等 。 
(4) Tools 菜单 。 
此 菜单 包括 简单 的 图 形 操作 和 照相 操作 。 在 此 只 介绍 图 形 操作 。 
。 Basic Fitting 命令 : 打开 图 形 基本 数据 拟 合 对 话 框 。 在 该 对 话 框 中 , 用户 可 以 根据 需 
要 选择 拟 合 的 数据 源 ( Select data )、 拟 合 方式 ( Check to display fits on figure )、 拟 
合 函 数 的 显示 ( Show equations )、 数 值 的 有 效 位 数 ( Significant digits )， 以 及 是 否 显 
示 残 差 ( Plot residuals ) 和 是 否 显示 最 大 残 差 模 ( Show norm of residuals ) 等 。 
。 Data Statistics 命令 : 打开 图 形 数据 统计 分 析 对 话 框 。 在 对 话 框 中 可 以 选择 数据 的 最 
小 值 ( min )、 最 大 值 ( max 外 平均 值 ( mean )、 中 值 ( median )， 以 及 均 方差 ( std ) 
等 。 


2 图形 窗口 的 工具 栏 
下 面 只 对 此 工具 栏 中 特殊 的 按钮 进行 叙述 ， 如 表 1-3 所 示 。 
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表 1-3 ”工具 栏 各 按钮 的 图 标 及 功能 


按钮 功能 








按钮 功能 











新 建 一 个 图 形 文件 








对 图 形 进行 三 维 手动 旋转 








打开 一 个 图 形 文件 





数据 指针 








以 .6e 的 格式 保存 图形 文件 








将 所 选 的 数据 点 刷 成 所 选 的 颜色 








打印 图 形 文件 








插入 颜色 工具 栏 








使 图 形 窗口 处 于 被 编辑 状态 





插入 图 例 








放大 图 形 


隐藏 绘图 工具 








缩小 图 形 


旦 示 绘 图 工具 





拖 动 图 形 














1.4.7 “MATLAB 文件 管理 


MATLAB 提供 了 一 组 文件 管理 命令 , 包括 列 文件 名 、 显 示 或 删除 文件 、 显 示 或 改变 当 
前 目录 等 ， 相 关 的 命令 及 其 功能 如 表 1-4 所 示 。 


表 1-4 ”MATLAB 常用 文件 管理 命令 
功能 锡 令 功能 
显示 当前 目录 与 MATLAB 相关 的 文件 及 路 径 “| "ype filename ss 











显示 当前 目录 下 所 有 的 文件 删除 文件 filename 
返回 上 一 级 目录 
显示 当前 日 录 


dclete filename 





显示 某 个 文件 的 路 径 cd 
由 当前 目录 进入 path 目录 cd 








1.4.8 MATLAB 帮助 


MATLAB 为 用 户 提供 了 非常 丰富 的 帮助 信息 ， 如 软件 产品 帮助 ( Product Help 和 函数 
帮助 ( 函数 浏览 器 )、 网 络 资源 帮助 等 ， 极 大 地 完善 了 该 应 用 软件 的 功能 。 

MATLAB 在 命令 窗口 提供 了 可 以 获得 帮助 的 命令 ,用 户 可 以 很 容易 地 获得 联机 帮助 信 
息 ， 几 个 常用 的 帮助 命令 介绍 如 下 。 

(1 ) helpwin:， 帮助 窗口 。 

(2 ) helpdesk， 帮 助 桌面 ， 浏 览 器 模式 。 

( 3 ) lookfor， 返 回 包含 指定 关键 词 的 项 。 

(4 ) demo: 打开 示例 窗口 。 

MATLAB 还 提供 了 丰富 的 help 命令 ， 如 表 1-5 所 示 ， 在 命令 窗口 中 输入 相关 命令 就 
可 以 获得 相关 的 帮助 。 


表 1-5 MATLAB 常用 帮助 命令 
功能 功 能 









help matfun 


德 阵 函 数 ， 数 值 线性 代数 


数据 分 析 和 傅 里 叶 变换 函数 














help general 
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通用 命令 


操作 符 和 特殊 字符 
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续 表 
命令 功能 命令 功能 
help graphics 通用 图 形 函 数 help polyfun 多 项 式 和 内 播 函数 
help elfun 基本 的 数学 函数 heip lang 语言 结构 和 调试 

















help elmat 基本 矩阵 和 矩阵 操作 help strfun 字符 囊 函 数 
help control 控制 系统 工具 箱 函 数 





MATLAB 的 一 个 重要 特色 ， 就 是 它 具有 一 套 程序 扩展 系统 和 一 组 称 之 为 工具 箱 
( Toolbox ) 的 特殊 应 用 子 程序 。 工 具 箱 是 MATLAB 的 关键 部 分 ， 它 是 MATLAB 强大 功能 
得 以 实现 的 载体 和 手段 ， 它 是 对 MATLAB 基本 功能 的 重要 扩充 。 

MATLAB 的 工具 箱 每 年 都 会 有 一些 变化 , 要 么 是 出 现 新 的 工具 箱 或 实用 工具 , 要 么 是 
原 有 工具 箱 的 性 能 得 到 改进 。 因 此 ， 在 一 般 情况 下 ， 工 具 箱 的 列表 不 是 固定 不 变 的 ， 有 关 
MATLAB 工具 箱 的 最 新 信息 可 以 在 http:/www.mathworks.com/products 中 看 到 。 

MATLAB 有 30 多 个 工具 箱 ， 大 致 可 分 为 两 类 : 功能 型 工具 箱 和 领域 型 工具 箱 。 

( 1 ) 功能 型 工具 箱 主要 用 来 扩充 MATLAB 的 符号 计算 功能 、 图 形 建 模仿 真 功能 、 文 
字 处 理 功能 ， 以 及 与 硬件 实时 交互 功能 ， 能 用 于 多 种 学 科 。 

( 2 ) 领域 型 工具 箱 专业 性 很 强 ， 是 针对 某 个 专业 的 常用 算法 做 成 的 函数 包 ， 如 控制 系 
统 工具 箱 ( Control System Toolbox 外 信号 处 理工 具 箱 ( Signal Processing Toolbox )、 人 金融 
工具 箱 ( Financial Toolbox ) 等 。 

运行 MATLAB 后 , 选择 "Start" 一 “Toolboxes”, 便 会 看 到 按 字母 顺序 列 出 的 MATLAB 
工具 箱 。 

下 面 简要 列举 常用 计算 相关 的 工具 箱 所 包含 的 主要 内 容 。 


1. 最 优 工具 箱 Optimization Toolbox) 
( 1 ) 线性 规划 和 二 次 规划 
( 2 ) 求 函数 的 最 大 值 和 最 小 值 
(3 ) 多 目标 优化 
(4 ) 约束 条 件 下 的 优化 
( 5 ) 非 线性 方程 求解 


2. 符号 数学 工具 箱 (Symbolic Math Toolbox) 
( 1 ) 符号 表达 式 和 符号 矩阵 的 创建 
(2 ) 符号 微 积 分 、 线 性 代数 、 方 程 求 解 
( 3 ) 因 式 分 解 、 展 开 和 简化 
(4) 符号 函数 的 二 维 图 形 
(5 ) 图 形 化 函数 计算 器 
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3. 样 条 工具 箱 (Spline Toolbox) 
(1 ) 分 段 多 项 式 和 B 样 条 
(2 ) 样 条 的 构造 
(3 ) 曲线 拟 合 及 平滑 
(4 ) 函数 微 积分 


本 章 首先 概要 讲述 了 MATLAB 的 产生 和 发 展 历程 、 其 优势 及 特点 ， 然 后 一 一 讲述 了 
MATLAB 的 系统 结构 、 工 具 箱 和 桌面 操作 环境 ， 本 章 是 全 书 内 容 的 基础 ， 需 要 扎实 学 握 。 
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MATLAB 也 是 一 门 计算 语 言 , 它 的 运算 指令 和 语法 都 是 基于 一 系列 基本 的 矩阵 运算 以 
及 它们 的 扩展 运算 的 ， 它 还 支持 复数 这 一 数值 元 素 ， 这 也 是 MATLAB 区 别 于 其 他 高 级 语 
言 的 最 大 特点 之 一 ， 它 给 许多 领域 的 计算 带 来 了 极 大 方便 。 


MATLAB 数值 类 型 


MATLAB 包括 4 种 基本 数据 类 型 , 即 双 精 度数 组 、 字 符 串 数组 、 元 胞 数组 、 构 架 数组 。 
而 且 数 据 之 间 可 以 相互 转化 ， 这 为 其 计算 功能 开拓 了 广阔 的 空间 。 


1， 变量 与 常量 
变量 是 数值 计算 的 基本 单元 。 与 C 语言 等 其 他 高 级 语言 不 同 ，MATLAB 语言 中 的 变 
量 无 须 事先 定义 ， 一 个 变量 以 其 名 称 在 语句 命令 中 第 一 次 合法 出 现 而 定义 ， 运 算 表达 式 变 
量 中 不 允许 有 未 定义 的 变量 ， 也 不 需要 预先 定义 变量 的 类 型 ，MATLAB 会 自动 生成 变量 ， 
并 根据 变量 的 操作 确定 其 类 型 。 
(1) MATLAB 变量 命名 规则 
MATLAB 中 的 变量 命名 规则 如 下 : 
。 变量 名 区 分 大 小 写 ， 因 此 4 与 a 表示 的 是 不 同 的 变量 。 
。 变量 名 以 英文 字母 开始 ， 第 一 个 字母 后 可 以 使 用 字母 、 数 字 、 下 画 线 ， 但 不 能 使 用 
空格 和 标点 符号 。 
。 变量 名 长 度 不 得 超过 31 位 ， 超 过 的 部 分 将 被 忽略 。 
。 某 些 常量 也 可 以 作为 变量 使 用 , 如 i 在 MATLAB 中 表示 虚数 单位 , 但 也 可 以 作为 变 
量 使 用 。 
常量 是 指 那些 在 MATLAB 中 已 预先 定义 其 数值 的 变量 ， 默 认 的 常量 如 表 2-1 所 示 。 


表 2-1 MATLAB 默认 常量 
































名 称 说 明 
ps 浮 点 数 的 相对 误差 
INF (或 inf) ii 或 j) 虚数 单位 ， 定 义 为 上 
NaN (或 nan ) 代表 不 定 值 ( 即 00 ) margin 函数 实际 输入 参数 的 个 数 
Realman 最 大 的 正 实数 margout 函数 实际 输出 参数 的 个 数 
Realmix 最 小 的 正 实数 ANS (或 ams) 默认 变量 名 ， 以 应 答 最 近 一 次 操作 运算 结果 
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(2) MATLAB 变量 的 显示 

任何 MATLAB 语句 的 执行 结果 都 可 以 在 屏幕 上 显示 ， 同 时 赋值 给 指定 的 变量 ， 没 有 
指定 变量 时 ， 赋 值 给 一 个 特殊 的 变量 ans， 数 据 的 显示 格式 由 format 命令 控制 。format 只 
影响 结果 的 显示 ， 不 影响 其 计算 与 存储 。MATLAB 总 是 以 双 字 长 浮 点 数 ( 双 精度 ) 来 执行 
所 有 的 运算 。 如 果 结 果 为 整数 , 则 显示 没有 小 数 ; 如 果 结 果 不 是 整数 , 则 输出 形式 有 表 2-2 
所 示 的 几 种 形式 。 





表 2-2 ”MATLAB 的 数据 显示 格式 














格式 


formattshort) 


含义 
短 格式 ( 5 位 定点 数 ) 


Tomationge 长 格式 e 方 式 
长 格式 ( 15 位 定点 数 ) 
短 格式 e 方式 


format bank 2 位 十 进 制 格式 
format hex 十 六 进 制 格式 
(3) MATLAB 变量 的 存 取 


工作 空间 中 的 变量 可 以 用 save 命令 存储 到 磁盘 文件 中 。 输 入 命令 “save< 文 件 名 > ， 
将 工作 空间 中 全 部 变量 存 到 “< 文件 名 >.mat” 文 件 中 去 ， 若 省 略 “< 文件 名 >” 则 存 入 文件 
matlab.mat 中 ;命令 “save < 文件 名 > < 变量 名 集 >” 将 “< 变量 名 集 >” 指 出 的 变量 存 入 文件 
“< 文件 名 >.mat” 中 。 

用 oad 命令 可 将 变量 从 磁盘 文件 读 入 MATLAB 的 工作 空间 ， 其 用 法 为 “load < 文件 名 > ， 
它 将 “< 文件 名 >"” 指 出 的 磁盘 文件 中 的 数据 依次 读 入 名 称 与 “< 文件 名 >” 相 同 的 工作 空间 
中 的 变量 中 去 。 若 省 略 “< 文 件 名 >” 则 从 matlab.mat 中 读 入 所 有 数据 。 

用 clear 命令 可 从 工作 空间 中 清除 现存 的 变量 。 


2. 字符 串 

字符 是 MATLAB 中 符号 运算 的 基本 元 素 ， 也 是 文字 等 表达 方式 的 基本 元 素 ， 在 
MATLAB 中 ， 字 符 串 作为 字符 数组 用 单 引号 ( ' ) 引用 到 程序 中 ， 还 可 以 通过 字符 串 运 算 
组 成 复杂 的 字符 串 。 字 符 串 数值 和 数字 数值 之 间 可 以 进行 转换 ， 也 可 以 执行 字符 串 的 有 关 
操作 。 


3， 元 胞 数组 

元 胞 是 元 胞 数组 ( Cell Array ) 的 基本 组 成 部 分 。 元 胞 数组 与 数字 数组 相似 ， 以 下 标 来 
区 分 ， 元 胞 数组 由 元 胞 和 元 胞 内 容 两 部 分 组 成 。 用 花 括号 “{ }” 表 示 元 胞 数组 的 内 容 ， 用 
圆 括号 “0” 表 示 元 胞 元 素 。 与 一 般 的 数字 数组 不 同 ， 元 胞 可 以 存放 任何 类 型 、 任 何 大 小 
的 数组 ， 而 且 同 一 个 元 胞 数组 中 各 元 胞 的 内 容 可 以 不 同 。 

【 例 2-1】〗】 ”元 胞 数组 创建 与 显示 实例 。 
解 ， MATLAB 程序 代码 如 下 。 


R(1I，1)={'an example of cell array')7 
RA(1，2)={[1 2;3 4])7 
At2，1)}=tcf (1，[1，8]); At2，2]}=(A(1，2) ;This is an example']7 


含义 















format long 


















format short e 
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celldisp (A) s 显 示 该 元 胞 数组 

元 胞 数组 4 的 第 1 行 用 元 胞 数组 标志 法 建立 一 个 字符 串 和 一 个 矩阵 ; 第 2 行 用 元 胞 内 
容 标志 法 ， 建 立 一 个 传递 函数 和 一 个 由 两 个 元 素 组 成 的 元 胞 组 ， 该 元 胞 组 分 别 是 矩阵 和 字 
符 串 ， 最 后 ， 用 celldisp 函数 显示 该 元 胞 数组 4。 
4. 构架 数组 

与 元 胞 数组 相似 ， 构 架 数组 ( Structure Array ) 也 能 存放 各 类 数据 ， 使 用 指针 方式 传递 
数值 。 构 架 数组 由 结构 变量 名 和 属性 名 组 成 , 用 指针 操作 符 “." 连接 结构 变量 名 和 属性 名 。 
例如 ， 可 用 parametertemperature 表示 某 一 对 象 的 温度 参数 ， 用 parameterhumidity 表示 某 
一 对 象 的 湿度 参数 等 ， 因 此 ， 该 构架 数组 parameter 由 两 个 属性 组 成 。 


5 对象 

面向 对 象 的 MATLAB 语言 采用 了 多 种 对 象 ， 如 自动 控制 中 常用 的 传递 函数 模型 对 象 
(tf object ) 状 态 空间 模型 对 象 { ss object ) 和 零 极点 模型 对 象 ( zpk object )， 一 些 对 象 之 
间 可 以 相互 转换 ， 例 如 可 以 从 传递 函数 模型 对 象 转化 为 零 极点 模型 对 象 ， 这 将 在 后 面具 体 
介绍 。 


-关系 运算 和 逻辑 运算 

除了 传统 的 数学 运算 外 , MATLAB 还 支持 关系 运算 和 逻辑 运算 。 如 果 你 已 经 有 了 一 些 
编程 经 验 ， 对 这 些 运算 不 会 卫生。 这些 操作 符 和 函数 的 目的 是 提供 求解 真 / 假 命题 的 答案 。 
关系 运算 和 逻辑 运算 主要 用 于 控制 基于 真 / 假 命题 的 各 MATLAB 命令 ( 通常 在 M 文件 中 ) 
的 流程 或 执行 次 序 。 

作为 所 有 关系 表达 式 和 逻辑 表达 式 的 输入 ，MATLAB 把 任何 非 0 数值 当做 真 ， 把 0 
当做 假 。 所 有 关系 表达 式 和 逻辑 表达 式 ， 对 于 真 ， 输 出 为 1， 对 于 假 ， 输 出 为 0。 

MATLAB 为 关系 运算 和 逻辑 运算 提供 了 关系 操作 符 和 逻辑 操作 符 ， 如 表 2-3 和 表 2-4 
所 示 。 


表 2-3 ”关系 运算 符 


功 





小 于 


< 小 于 或 等 于 一 等 于 
> 大 于 -= 不 等 于 
































此 外 ，MATLAB 还 提供 了 若干 关系 运算 函数 和 逻辑 运算 函数 ， 分 别 如 表 2-5 和 表 2-6 
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所 示 。 





表 2-5 ”关系 运算 函数 


[ 画 玫 名 功能 函数 名 动能 
al 所 有 向 量 为 非 夫 元素 时 为 真 Xor 还 辑 异 或 运算 
any 任 一 向 量 为 非 霍 元素 时 为 真 


表 2-6 远 辑 运算 函数 
































画 效 名 | 功 “能 函数 名 功能 
ad 位 方式 的 过 加 与 运算 本 位 比较 运 算 
ier 位 方式 的 过 辑 或 运 筑 Bi 最 大 无 符号 汉 点 整数 
bitxor 位 方式 的 运 辑 异 或 运算 bitshif 将 二 进 制 移 位 运算 











矩阵 及 其 运算 


MATLAB 软件 的 最 大 特色 是 强大 的 矩阵 计算 功能 ， 在 MATLAB 软件 中 ， 所 有 的 计算 
都 是 以 矩阵 为 单元 进行 的 ,可 见 矩 阵 是 MATLAB 的 核心 o 下 面 以 表格 的 形式 列 出 MATLAB 
提供 的 每 类 矩阵 运算 的 函数 ， 并 各 举 一 个 实例 进行 说 明 ， 同 类 函数 的 用 法 基本 类 似 ， 详 细 
的 用 法 及 函数 内 容 说 明 可 参考 联机 帮助 。 


2.3.1 ”矩阵 的 创建 


由 普 行 呈 列 构成 的 数组 4 称 为 mx 阶 矩 阵 , 它 总 共 由 疾 xm 个 元 素 组 成 , 矩阵 元 素 记 
为 m ， 其 中 1 表示 行 ，/ 表示 列 。 

当 丸 = 站 时 ， 矩 阵 4 称 为 方 阵 。 当 i#j 时 ， 所 有 的 mi =0， 且 疾 = 站 ， 得 到 的 矩阵 称 
为 对 角 阵 。 

当 对 角 阵 的 对 角 线 上 的 元 素 全 为 1 时 ， 称 为 单位 阵 ， 记 为 To 

对 于 (mx 门 阶 矩 阵 钾 ， 当 Wi =oj 时 ， 称 外 是 4 的 转 置 矩 阵 ， 记 为 W=4' 

对 于 4 为 (mxl) 的 形式 时 ， 称 4 是 mm 个 元 素 的 列 向 量 ， 对 于 4 为 1x 站 的 形式 时 ， 
称 4 是 "个 元 素 的 行 向 量 。 

矩 阵 的 表现 形式 和 数组 相似 ， 它 以 左 方 括号 “[” 开 始 ， 以 右 方 括号 “] ”结束 ， 每 一 
行 元 素 结束 用 行 结束 符号 ( 分 号 “;" ) 或 回 车 符 分 割 ， 每 个 元 素 之 间 用 元 素 分 割 符号 ( 空 
格 或 “," ) 分 隔 。 建 立 矩阵 的 方法 有 直接 输入 矩阵 元 素 、 在 现 有 和 矩阵 中 添加 或 删除 元 素 、 
读 取 数据 文件 、 采 用 现 有 短 阵 组 合 、 和 矩阵 转向 、 和 矩阵 移 位 ， 以 及 直接 建立 特殊 矩阵 等 。 


【 例 2-2】 ”和 珑 阵 创建 实例 。 
解 ， MATLAB 程序 代码 如 下 。 
>> RM=I1 23;45 6) 


运行 结果 是 创建 了 一 个 2x3 的 矩阵 4，4 的 第 1 行 由 1、2、 3 这 3 个 元 素 组 成 ， 第 2 
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行 由 4、5、6 这 3 个 元 素 组 成 ， 输 出 结果 如 下 


>> B=IA; 11，12，13] % 添 加 一 行 元 素 [11，12，13] 


运行 结果 是 创建 了 一 个 3x 3 的 矩阵 瑟 , 有 矩阵 是 在 4 矩阵 的 基础 上 添加 一 行 元 素 11、 
12、13， 组 成 一 个 3x 3 和 矩阵 ， 输 出 结果 如 下 : 

2 3 
1 2 卫 


MATLAB 中 对 和 矩阵 元 素 的 访问 如 下 所 示 : 

。 单个 元 素 的 访问 ，B(3, 2) 一 12， 访 问 了 第 3 行 和 第 2 列 交叉 的 元 素 。 

。 整 列 元 素 的 访问 ，B(:, 3) 一 [3, 6, 13}， 访 问 了 第 3 列 中 的 所 有 元 素 。 

。 整 行 元 素 的 访问 : B(1, :) 一 [1, 4, 11]， 访 问 了 第 1 行 中 的 所 有 元 素 。 

。 整 块 元 素 的 访问 ，B(2:3, 2:3) 一 [ 5, 6; 12, 131， 访 问 了 一 个 2 x 2 的 子 块 矩 阵 。 

MATLAB 提供 了 很 多 个 特殊 矩阵 的 生成 函数 ， 表 2-7 列 出 了 一 些 常用 的 生成 函数 ， 关 
于 其 他 的 特殊 矩阵 生成 函数 及 使 用 格式 ， 请 参见 联机 帮助 。 


表 2-7 ”MATLAB 常用 特殊 矩阵 生成 函数 
















































功能 说 明 函数 功能 说 明 
生成 元 素 全 为 0 的 矩阵 il0 生成 下 三 角 矩阵 
生成 元 素 全 为 1 的 矩阵 eye0) 生成 单位 矩阵 

| rand() 生成 均匀 分 布 随机 矩 阵 company() 生成 伴随 矩阵 

| man0 生成 正 态 分 布 随机 矩阵 hilb0) 生成 Hilber 撼 阵 
magic() 生成 魔方 矩阵 vander0) 生成 Vander 矩阵 
diag() 生成 对 角 和 矩阵 hankel0 生成 Hankel 矩阵 
triu() 生成 上 三 角 矩 阵 hadamardO) 生成 Hadamard 撼 阵 











【 例 2-3】 特殊 矩阵 生成 函数 使 用 实例 。 
解 ; MATLAB 程序 代码 如 下 。 


>> A=I1，2，3; 4，5，6; 7，8，9]; B=tril(A) % 生 成 下 三 角 和 矩阵 


运行 结果 是 生成 了 她 矩阵 ， 它 是 调用 下 三 角 和 矩阵 生成 函数 til0 生 成 的 矩阵 4 的 下 三 
角 和 矩阵 ， 输 出 结果 如 下 : 


B = 1 0 0 
和 0 
芝 8 9 
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2.3.2 ”矩阵 的 运算 
矩阵 与 矩阵 之 间 可 以 进行 如 表 2-8 所 示 的 基本 运算 。 
这 守 二 过 和 下 卫 07 各 凡人 ， 汪 后 本 的 维 关 所 相等 。 


表 2-8 ”和 矩阵 基本 运算 





功能 说 明 





珑 阵 的 左 除 
矩阵 转 置 

德 阵 对 数 运 算 
矩阵 指数 运算 
短 阵 求 逆 























【 例 2-4】 ”和 矩阵 基本 运算 实例 。 
解 ， MATLAB 程序 代码 如 下 。 
>> aeI1，2; 3，4]; B-[3，5; 2，9]; divl1=A/B; % 矩 阵 的 左 除 
>>div2=B\A 。% 和 矩阵 的 右 除 
两 个 矩阵 4 与 下 进 行 了 左 除 和 右 除 运算 ， 输 出 结果 如 下 ; 


Qivl = Qiv2= 
0.2941 0.0588 -0.3529 -0.1176 
1.1176 -0.1765 0.4118 0.4706 


MATLAB 提供 了 多 种 关于 矩阵 的 函数 ， 表 2-9 列 出 了 一 些 常用 的 矩阵 函数 运算 。 


表 2-9 ”常用 矩阵 函数 运算 
功能 说 明 功能 说 明 
短 阵 逆 时 针 旋转 90" 计算 短 阵 的 特征 值 和 特征 向 量 
矩阵 上 下 翻转 计算 矩阵 的 秩 
| 短 阵 左右 翻转 计算 矩阵 的 琉 
fipdimO) | 答 了 的 某 维 元 素 翻 转 计算 矩阵 的 范 数 
shiftdimO) 矩阵 的 元 素 移 位 计算 矩阵 的 特征 方程 的 根 


【 例 2-5】 ”和 矩阵 函数 运算 实例 。 
解 : MATLAB 程序 代码 如 下 。 
4，6; 7，9，13]; ，[B，Ccl=eig(A) 。s 求 取 和 矩阵 的 特征 值 和 特征 向 量 
通过 函数 eig() 计 算 和 矩阵 4 的 特征 向 量 和 特征 值 c， 输 出 结果 如 下 : 


B=-0.3008 -0.7225 ”0.2284 
-0.3813 -0.3736 -0.8517 
-0.8742 ”0.5817 “0.4717 

C = 19.3341 0 0 




















>> PR=I1，3，5) 2 
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0 -1.4744 0 
0 0 0.1403 


和 矩阵 分 解 常用 于 方程 求 根 ， 表 2-10 列 出 了 一 些 常用 的 矩阵 分 解 运算 。 


表 2-10 ”常用 矩阵 分 解 运算 函数 





功能 说 明 
| 短 阵 的 奇异 值 分 角 

短 阵 的 Cholesky 分 解 
短 阵 的 LU 分 解 








算 阵 的 QR 分 解 
矩阵 的 Schur 分 解 





【 例 2-6】 和 矩阵 分 解 运算 实例 。 
解 : MATLAB 程序 代码 如 下 。 


和 6，2，1; 2，3，1; 1，1，1]; [L，U，P]=lu(a) # 对 和 阵 进行 LU 分 解 


通过 函数 lu0 对 和 矩阵 4 进行 LU 分 解 ， 得 到 上 三 角 阵 以、 下 三 角 阵 也、 置换 矩阵 P， 


L =1.0000 0 0 U= 6.0000 2.0000 1.0000 
0.3333 1.0000 0 0 2.3333 0.6667 
0.1667 0.2857 1.0000 0 0 0.6429 

了 = 0 0 





复数 以 及 在 其 基础 上 发 展 起 来 的 复 变 函数 这 一 重要 的 数学 分 支 ， 解 决 了 许多 实 变 函 数 
无 法 解决 的 问题 ， 有 着 广泛 的 工程 应 用 。 

复 变 函数 是 控制 工程 的 数学 基础 ， 常 用 来 描述 控制 系统 模型 的 传递 函数 ， 就 是 属于 复 
变 函 数 。MATLAB 支持 在 运算 和 函数 中 使 用 复数 或 复数 矩阵 ， 还 支持 复 变 函数 运算 。 
2.4.1 复数 表示 


MATLAB 是 以 i 或 j 字 元 来 代表 虚 部 复数 运算 的 。 
一 个 复数 可 表示 为 : x= a+5i ， 其 中 a 称 为 实 部 ，2 称 为 虚 部 。 
也 可 写成 复 指数 形式 ，x= me” 。 其 中 ~ 称 为 复数 的 模 ， 又 记 为 1x1; 8 称 为 复数 的 幅 


角 ， 又 记 为 4r8(x) ， 且 满足 如 下 关系 : 
r=va2+2 ， ng 人 
具体 采用 哪 种 表示 方法 取决 于 实际 问题 。 一 般 而 言 ， 第 一 种 问题 适合 处 理 复数 的 代数 
运算 ， 第 二 种 方法 适合 处 理 复数 旋转 等 涉及 幅 角 改变 的 问题 。 


可 晤 可 本 25 


精通 MATLAB 神经 网 络 


一 个 复数 也 可 以 看 做 是 关于 实 部 和 虚 部 的 符号 函数 。 因 此 ， 既 可 以 直接 构造 复数 ， 也 
可 以 用 符号 函数 构造 复数 。 下 面 分 别 介绍 这 两 种 构造 方法 。 


(1) 用 直接 法 构造 两 种 形式 的 复数 


直接 法 就 是 利用 符号 i 或 j 来 表示 复数 单位 ， 将 复数 看 做 完整 的 一 个 表达 式 。 其 具体 
形式 也 有 两 种 ， 可 以 用 实 部 和 虚 部 形式 表示 ， 也 可 以 用 复 指数 形式 表示 。 


(2 ) 用 符号 函数 法 构造 两 种 形式 的 复 教 


所 谓 符号 函数 法 就 是 将 复数 看 成 是 函数 形式 ， 将 其 实 部 和 虚 部 看 做 自 变量 ， 用 syms 
来 构造 ， 用 subs 对 符号 函数 中 自 变 量 进行 赋值 


【 例 2-7】〗】 ”复数 构造 实例 。 试 分 别 使 用 上 述 两 种 方法 ， 在 MATLAB 中 构造 复数 
X= 一 1+io 


解 : 在 MATLAB 命令 窗口 中 输入 : 


xl=-1+i # 直 接 法 构造 , 实 部 虚 部 形式 
x2=sqrt (2) *exp(i*(3*pi/14) ) $% 直 接 法 构造 , 复 指数 形式 
% 符 号 函数 法 构造 , 实 部 虚 部 形式 

syms a b real7 #% 声 明 a，b 为 实数 型 

x3=a+b*i % 实 部 、 虚 部 形式 复数 的 符号 表达 

subs (x3,{a,bj,{-1,1)) % 代 入 具体 值 

% 符 号 函数 法 构造 , 复 指数 形式 

syms r ct real; % 声 明 =，ct 为 实数 型 
x4=rxexp(ct*i) ; % 复 指数 形式 复数 的 符号 表达 
subs(x4, {r,ctj,{fsqrt(2),3*pi/14))% 代 入 具体 什 


输出 结果 为 ， 


xl 
x2 
X3 
x4 








-1.0000 + 1.0000i 
-1.0000 + 1.0000i 
-1.0000 + 1.0000i 
-1.0000 + 1.0000i 

MATLAB 中 和 矩阵 运算 贯穿 始终 ， 复 数 矩 阵 运算 也 是 其 中 的 一 个 重要 方面 。 由 于 复数 
和 矩阵 的 每 个 元 素 都 是 复数 ， 所 以 对 应 的 创建 复数 矩阵 的 方法 也 有 两 种 ， 即 直接 创建 和 利用 
符号 函数 创建 。 

复数 矩阵 的 直接 创建 有 两 种 方法 ， 一 种 是 由 复数 元 素 ， 构 造 复数 矩阵 ， 另 一 种 是 利用 
两 个 矩阵 分 别 做 实 部 和 虚 部 构造 新 的 复数 矩阵 。 下 面 举例 说 明 复 数 矩 阵 的 直接 创建 ， 另 一 
种 方法 类 比 很 容易 实现 ， 在 此 不 作 商 述 。 

(1) 由 复数 元 素 构造 复数 答 阵 

复数 矩阵 的 每 个 元 素 都 是 复数 ， 将 复数 作为 矩阵 元 素 ， 并 按照 矩阵 格式 进行 填充 就 得 
到 了 复数 矩阵 。 

(2 ) 由 实 撼 阵 创造 复数 天 阵 

由 两 个 分 别 作为 实 部 和 虐 部 的 同 维 矩阵 构造 复数 矩阵 。 


[ 丰 训 本 
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【 例 2-8] 复数 矩阵 构造 实例 。 榴 造 复数 和 阵 | 人 号 
i 


: 可 直接 输入 各 元 素来 构造 矩阵 ， 此 处 通过 其 复 指数 形式 构造 。 


在 MATLAB 命令 窗口 中 输入 : 


% 直 接 输入 各 元 素来 构造 


AlI=[sqrt (2)*exp((Pi/4)*) 1+2i 1+3i;sqrt(2)*exp((-pi/4)wi) 1-2i1 1-3i] g 
% 由 实 矩 阵 构造 
RA2re=[1 1 1;1 1 1]; A2im=[1 2 3;-1 -2 -3] ; A2=A2re+R2imsi 


输出 结果 Al 和 A2 均 为 . 


1.0000 + 1.0000i 1.0000 + 2.0000i 1.0000 + 3.0000i 
1.0000 - 1.0000i 1.0000 - 2.0000i 1.0000 - 3.0000i 


2.4.2 ”复数 绘图 


对 于 复数 函数 的 绘图 主要 有 两 种 形式 。 一 种 是 直角 坐标 图 ， 即 分 别 以 复数 的 实 部 和 虑 


部 为 坐标 作出 复数 的 表示 图 ; 另 一 种 为 极 坐标 图 ， 即 分 别 以 复数 的 模 和 幅 角 为 坐标 作 图 。 


MATLAB 提供 了 绘制 极 坐标 图 的 函数 polar， 它 还 可 绘制 出 极 坐标 栅 格 线 ， 其 常用 的 


调用 格式 为 ， 


polar (theta,rho) 
其 中 ，theta 为 极 坐标 极 角 ，rho 为 极 坐标 矢 径 。 
区 卫生 孝 丁 玫 寺 因 例 作 吕 畏 政 了 二 和 村 让 的 本 直 国 4 








， 以 


幅 角 为 极 角 ， 在 MATLAB B 命令 窗口 中 输入 以 下 命令 ， 最 终 显 示 结果 如 图 2-1 所 示 。 


t=0:0.01:2*pi; Y=t+i*t.*sin(t); % 直 角 坐 标 表示 
r=abs (y) ;bdelta=angle(Yy) % 极 坐标 表示 

subplot (2,1,1) 

plot (yY) 。 % 绘 制 直角 坐标 图 

title(' 直 角 坐 标 图 ') ; subplot(2,1,2) 

polar (Gelta,z) % 绘 制 极 坐标 图 
title(' 极 坐标 图 ') 


直角 坐标 图 





0 1 2 3 加 5 6 7 


图 2-1 极 坐标 下 复数 的 表示 
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2.4.3 ”复数 操作 函数 


对 于 一 个 形 如 x= a+ 押 的 复数 , 我 们 通常 希望 能 够 了 解 它 自身 的 结构 性 质 , 包括 实 部 、 
虚 部 、 模 和 幅 角 等 。MATLAB 提供 了 方便 的 操作 函数 ， 如 表 2-11 所 示 。 





表 2-11 ”常用 矩阵 分 解 运算 函数 


























| 画 数 名 功能 函数 名 功能 | 
real) 求 复数 或 复数 矩阵 4 的 实 部 abs(h) 求 复数 或 复数 答 阵 4 的 模 

imag(4) 求 复数 或 复数 矩阵 4 的 虚 部 angle(4) | 求 复数 或 复数 矩阵 4 的 相 角 ， 单 位 为 弧度 
ceonj) 求 复数 或 复数 矩阵 4 的 共生 





在 MATLAB 中 ， 复 数 的 基本 运算 和 实数 相同 ， 都 是 使 用 相同 的 函数 。 比 如 复数 或 复 
数 矩 阵 x 除 以 ， 运 算命 令 也 是 zx， 与 实数 运算 一 样 。 因 此 ， 复 数 基本 运算 的 内 容 此 处 不 
再 费 述 。 


符号 运算 


MATLAB 提供 了 符号 数学 工具 箱 ( Symbolic Math Toolbox )， 大 大 增强 了 MATLAB 的 
功能 。 符 号 数学 工具 箱 的 特点 为 

( 1 ) 用 途 广泛 ， 而 不 仅 针对 一 些 特殊 专业 或 专业 分 支 。 

( 2 ) 使 用 字符 串 来 进行 符号 分 析 ， 而 不 是 基于 数组 的 数值 分 析 。 


2.5.1 ”符号 运算 概述 


符号 数学 工具 箱 是 操作 和 解决 符号 表达 式 的 符号 数学 工具 ( 函数 ) 集合 ， 有 复合 、 
化 、 微 分 、 积 分 ， 以 及 求解 代数 方程 和 微分 方程 的 工具 ， 另 外 还 有 一 些 用 于 线性 代数 的 工 
具 ， 求 解 着 、 行 列 式 、 正 则 形式 的 精确 结果 ， 找 出 符号 矩阵 的 特征 值 而 没有 由 数值 计算 引 
入 的 误差 。 工 具 箱 还 支持 可 变 精度 运算 ， 即 支持 符号 计算 并 能 以 指定 的 精度 返回 结果 。 

符号 运算 与 数值 运算 的 主要 区 别 如 下 

(1 ) 数值 运算 中 必须 先 对 变量 赋值 ， 然 后 才能 参与 运算 。 

( 2 ) 符号 运算 无 须 事先 对 独立 变量 赋值 ， 运 算 结果 以 标准 的 符号 形式 表达 。 

符号 运算 的 运算 对 象 可 以 是 没 赋值 的 符号 变量 ， 可 以 获得 任意 精度 的 解 。 
1. 符号 表达 式 

符号 表达 式 是 代表 数字 、 函 数 、 算 子 和 变量 的 MATLAB 字符 串 ， 或 字符 串 数组 。 不 
要 求 变量 有 预先 确定 的 值 ， 符 号 方程 式 是 含有 等 号 的 符号 表达 式 。 符 号 算术 是 使 用 已 知 的 
规则 和 给 定 符号 恒等式 求解 这 些 符号 方程 的 实践 ， 它 与 代数 和 微 积分 中 的 求解 方法 完全 一 
样 。 符 号 矩阵 的 元 素 是 符号 表达 式 。 

MATLAB 在 内 部 把 符号 表达 式 表示 成 字符 串 ,与 数字 变量 或 运算 相 区 别 ; 否则 , 这 些 
符号 表达 式 几乎 与 基本 的 MATLAB 命令 毫 无 区 别 。 
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2. 创建 符号 对 象 

MATLAB 提供 了 两 个 建立 符号 对 象 的 函数 : sym 和 syms, 这 两 个 函数 的 用 法 介绍 如 下 。 

(1) sym 函数 

sym 函数 用 来 建立 单个 符号 量 ， 一 般 调 用 格式 为 : 

符号 量 名 =sym( ' 符号 字符 串 ' ) 

该 函数 可 以 建立 一 个 符号 量 , 符号 字符 串 可 以 是 常量 、 变 量 、 函 数 或 表达 式 。 应 用 sym 
函数 还 可 以 定义 符号 常量 。 

(2 ) syms 函数 

函数 sym 一 次 只 能 定义 一 个 符号 变量 ， 使 用 起 来 不 方便 。MATLAB 提供 了 另 一 个 函 
数 syms， 一 次 可 以 定义 多 个 符号 变量 。 

syms 函数 的 一 般 调 用 格式 为 : 

syms 符号 变量 名 1 符号 变量 名 2 符号 变量 名 n 

用 这 种 格式 定义 符号 变量 时 不 要 在 变量 名 上 加 字符 串 分 界 符 ( ') ， 变 量 间 用 空格 而 不 
要 用 逗号 分 隔 。 

含有 符号 对 象 的 表达 式 称 为 符号 表达 式 ， 建 立 符号 表达 式 有 以 下 3 种 方法 ， 

。 利用 单 引 号 来 生成 符号 表达 式 。 

。 用 sym 函数 建立 符号 表达 式 。 

。 使 用 已 经 定义 的 符号 变量 组 成 符号 表达 式 。 

【 例 2-10】 符号 表达 式 创 建 实例 。 
解 : 在 MATLAB 窗口 ， 输 入 下 列 命令 : 


U=sym('3*x^2+5wy+2wXwy+6') % 定 义 符号 表达 式 

Syms x Y; % 建 立 符号 变量 x、Y 

V=3*X^2+5*y+2*Xwy+6 % 定 义 符号 表达 式 V 

2*U-V+6 % 求 符号 表达 式 的 值 
3. 符号 矩阵 


符号 和 矩阵 也 是 一 种 符号 表达 式 ， 所 以 前 面 介绍 的 符号 表达 式 运算 都 可 以 在 矩阵 意义 下 
进行 。 但 应 注意 这 些 函数 作用 于 符号 和 矩阵 时 ， 是 作用 于 矩阵 的 每 一 个 元 素 。 

通过 sym 函数 创立 符号 矩阵 ， 和 矩阵 元 素 可 以 是 任何 不 带 等 号 的 符号 表达 式 ， 各 符号 表 
达 式 的 长 度 可 以 不 同 ， 德 阵 元 素 之 间 可 用 空格 或 喜 号 分 隔 。 

例如 ， 在 命令 窗口 中 输入 “A = sym([a ,2*b ; 3+a ,0])”， 就 完成 了 一 个 符号 矩阵 


4-|: 区 |8e 时 输出 的 结果 为 : 
3a 0 


RAR= [a，2*b] 
[3*a，0] 
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需要 注意 的 是 : 符号 和 矩阵 的 每 一 行 的 两 端 都 有 方 括号 ， 这 是 与 MATLAB 数值 矩阵 的 
一 个 重要 区 别 。 

在 MATLAB 中 ， 数 值 矩阵 不 能 直接 参与 符号 运算 ， 必 须 先 转化 为 符号 矩阵 。 

(1 ) 将 数值 给 阵 转化 为 符号 矩阵 

函数 调用 格式 :sym( 数 值 矩 阵 ) 

(2 ) 将 符号 矩阵 转化 为 数值 给 阵 

函数 调用 格式 ， numeric(4) 

由 于 符号 矩阵 是 一 个 矩阵 , 所 以 符号 矩阵 还 能 进行 有 关 和 矩阵 的 运算 。MATLAB 还 有 一 
些 专用 于 符号 和 矩阵 的 函数 ， 这 些 函 数 作用 于 单个 的 数据 无 意义 。 例 如 : 

transpose(S)， 返回 $ 矩阵 的 转 置 矩阵 。 

determ(S): 返回 S 矩阵 的 行列 式 值 。 

其 实 ， 许多 应 用 于 数值 矩阵 的 函数 ， 如 diag、triu、tril、inv、det、rank、eig 等 ， 也 可 
直接 应 用 于 符号 矩阵 。 


4 符号 表达 式 的 四 则 运算 
符号 表达 式 的 四 则 运算 比较 简单 ， 常 用 的 函数 介绍 如 下 。 
e factor(S)， 对 S 分 解 因 式 ，$S 是 符号 表达 式 或 符号 矩阵 。 
e expand(S)， 对 $ 进行 展开 ，S 是 符号 表达 式 或 符号 矩阵 。 
e collect(S): 对 S 合并 同类 项 ，S 是 符号 表达 式 或 符号 矩阵 。 
。 collect(S,w)， 对 $ 按 变量 " 合并 同类 项 ，8 是 符号 表达 式 或 符号 矩阵 。 
e。 simplify(S)， 应 用 函数 规则 对 S 进行 化 简 。 
。 simple(S); 调用 MATLAB 的 其 他 函数 对 表达 式 进行 综合 化 简 ， 并 显示 化 简 过 程 。 


2.5.2 ”常用 的 符号 运算 


符号 变量 和 数字 变量 之 间 可 转换 ， 也 可 以 用 数字 代替 符号 得 到 数值 。 符 号 运算 种 类 
非常 多 ， 常 用 的 符号 运算 有 代数 运算 、 积 分 和 微分 运算 、 极 限 运算 、 级 数 求 和 、 方程 求 
解 等 。 

出 于 篇 幅 的 考虑 ， 下 面 仅 对 最 优化 计算 中 常用 的 符号 运算 进行 介绍 ， 其 他 的 符号 运算 
的 使 用 方法 大 同 小 异 ， 读 者 可 通过 MATLAB 的 帮助 文档 或 其 他 关于 符号 函数 工具 箱 的 书 
籍 进行 学 习 ， 此 处 不 再 熬 述 。 

常用 的 符号 运算 有 求 极 值 、 级 数 求 和 、 微 积分 、 解 微分 方程 等 ， 下 面 分 别 进行 介绍 。 





1. limit 
limit 是 求 极 限 的 符号 函数 ， 其 常用 的 格式 是 : 
limit(F，x，a，'right') 或 1imit(F，x，a， "1lefc ) 


表示 当 自 变量 x 从 右 侧 或 左 侧 逼近 ac 时 ， 函 数 严 的 极 值 。 
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2. diff 

diff 是 求 微分 最 常用 的 符号 函数 ， 其 输入 参数 既 可 以 是 函数 表达 式 ， 也 可 以 是 符号 
珑 阵 。 

常用 的 格式 是 : difft/，xr， 站 

表示 /关于 x 求 阶 导数 。 
3.，int 

int 是 求 积分 最 常用 的 符号 函数 ， 其 输入 参数 可 以 是 函数 表达 式 。 

常用 的 格式 是 : intf，r，x0，xl) 

其 中 , /为 所 要 积分 的 表达 式 ，r 为 积分 变量 ， 若 为 定 积分 ， 则 xz0 与 xl 为 积分 上 下 限 。 
4，symsum 

symsum 是 级 数 求 和 的 符号 函数 ， 其 常用 的 格式 是 : 

S=symsum(fk，k，k0，kn) 


其 中 全 为 级 数 的 通 项 ，k 为 级 数 自 变量 ，kKO 和 如 为 级 数 求 和 的 起 始 项 和 终止 项 ， 且 
可 设 为 inf。 


5. dsolve 
dsolve 求解 常 微分 方程 的 符号 函数 ， 其 常用 的 格式 是 : 
dsolve('eqn1'，'condition'，'var') 


该 函数 求解 微分 方程 eqnl 在 初 值 条 件 condition 下 的 特 解 。 参 数 var 描述 方程 中 的 自 
变量 符号 ， 省 略 时 按 默认 原则 处 理 ， 若 没有 给 出 初 值 条 件 condition， 则 求 方程 的 通 解 。 

dsolve 在 求 微分 方程 组 时 的 调用 格式 为 

dsolve('eqn1'，'eqn2，… …，'eqnN'，'conditionl'，…，'conditionN,，，varl，， 
"varN') 

函数 求解 微分 方程 组 eqn1,，…，, eqmN 在 初 值 条 件 condaitoion1,，…, condqitionN 
下 的 解 ， 若 不 给 出 初 值 条 件 ， 则 求 方程 组 的 通 解 ，varl1，…，varN 给 出 求解 变量 。 





【 例 2-11】 ”极限 和 极 值 的 符号 运算 实例 。 | | 求 和 


er| xn2x (xD 
50 
J2=> [om+(a-Dm]。 
气 
解 : 输入 如 下 MATLAB 程序 代码 。 


syms x a n % 定 义 符号 变量 a 和 x 
Y=1/(x* (1og(x)^2))-1V/(x-1)^27 
f1=1imit (y,x,1,'right') % 求 极限 
f=axn^3+ (a-1) *n^2 
f2=symsum(f,n,0,50) % 级 数 求 和 
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运行 程序 ， 输 出 结果 如 下 所 示 


f1 =1/12 
f2 =1668550*a - 42925 








可 站 二 1 _ 1 |-1 电 [ 5 ， ii 2]_ 

a 评 | 让 | 证， 过 [wm +(a-Dm2]=-42925+1668550*a 。 
【 例 2-12】 。 微 积 分 的 符号 运算 实例 。( 1 ) 已 知 表达 式 /= sin(ao)， 分 别 对 其 中 的 x 和 

a 求 导 ; ( 2 ) 已 知 表达 式 广 = xlog( + 如 ， 求 对 x 的 积分 和 Y 在 (0.0D) 上 的 积分 值 。 

解 : 输入 如 下 MATLAB 程序 代码 。 


SyYmSs  X s# 定 义 符号 变量 a 和 x 
f=sin(a*x) % 创 建 函数 上 
afx=aiff(E，x) % 对 x 求 导 
afa=diff(f，a) s# 对 a 求 导 
f1L=x*1og(1+x) S$ 创 建 函数 fl 
intl=int (fl,x) & 对 x 积分 
int2=int(ft1,x,0,1) # 求 [0,1] 区 间 上 的 积分 
运行 程序 ， 输 出 结果 如 下 所 示 : 

dfx =cos (ayx) va $%fE 对 x 求 导 的 结果 
Qfa =cos (a*X) *X 8%f 对 a 求 导 的 结果 
intl =x/2 - x^2/4 + (log(x + 1)*(x^2 - 1))/2 % 积 分 表达 式 
int2 =1/4 % 积 分 值 


【 例 2-13】 。 常 微分 方程 符号 运算 实例 。( 1 ) 计算 微分 方程 只 +3my= ae 的 通 解 。 


( 2 ) 计算 微分 方程 my +2y-ex = 0 在 初始 条 件 yl-i= 2e 下 的 特 解 。( 3 ) 求 y +2? +ex =0 

的 通 解 。 

解 : 输入 如 下 MATLAB 程序 代码 。 
fl=dsolve('Dy+3*Xx*y=Xwexp(-X^2)，'X') 
f2=dsolve('x*DY+2*yY-exp(x)=0'，y(1)=2*exp(1)"，'X') 
f3=dsolve('D2y+2*Dy+exp(x)=0'，x') 


运行 程序 ， 输 出 结果 如 下 所 示 : 


fl1=C9/exp((3*x^2)/2) + exp(x^2/12) /exp((3*x^2)712) 
f2 =(2*exp(1))/x^2 + (exp(x)*(x - 1))7/x^2 
f3 =C7/exp(2*x) - (exp(3*x)/13 + (C6*exp(2*x))/12) /exp(2*xX) 





ze 一 er 十 2e 
2 


3 .2 
可 知 ( 1 ) 的 通 解 为 ?= er-” +e 2 ”*C9 ,其 中 C9 为 常数 ;( 2 ) 的 特 解 为 ?= 


(3 ) 的 通 解 为 ?= 一 Cr *e-2x+C5， 其 中 Cy ，C6 为 常数 。 
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MAITLAB 语言 具有 强大 的 数值 计算 功能 ， 热 练 掌握 和 运用 这 些 功能 是 发 挥 MATLAB 
强大 功能 的 基础 。 
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俗话 说 “一 图 胜 万 语 "， 在 科学 研究 、 工 程 上 有 图 则 一 目 了 然 ， 无 图 搭配 则 如 隔 靴 椰 
痒 ， 很 难得 窥 得 全 貌 ， 这 也 是 一 般 工作 偏重 于 图 说 的 原因 。 

绘图 的 目的 如 果 是 显示 数据 的 走向 或 变化 趋势 , 则 可 采用 不 同 的 观察 角度 ， 使 数据 的 
内 容 更 加 明晰 。 就 图 的 特性 分 类 ， 可 以 分 为 块 状 图 、 柱 状 图 、 点 示 图 、 线 示 图 等 ， 而 就 其 
空间 而 言 ， 又 可 分 为 二 维 或 三 维 图 ， 前 者 取 其 实用 性 ， 后 者 取 其 美观 性 。 

MATLAB 提供 了 强大 的 图 形 功能 ,利用 程序 与 绘图 结合 ,可 以 将 计算 结果 以 图 形 显现 ， 
有 助 于 了 解 计 算 过 程 以 及 分 析 计算 结果 ， 这 一 点 在 科学 、 工 程 中 都 非常 重要 。 


_MATLAB 中 绘图 的 基本 步骤 


在 MATLAB 中 绘制 图 形 ， 通 常 采 用 以 下 7 个 步骤 ， 
1.， 准备 数据 
准备 好 绘图 需要 的 横 坐标 变量 和 纵 坐标 变量 数据 。 
2. 设置 当前 绘图 区 
在 指定 的 位 置 创建 新 的 绘图 窗口 ， 并 自动 以 此 窗口 的 绘图 为 当前 绘图 区 。 
3. 绘制 图 形 
创建 坐标 轴 ， 指 定 知 加 绘图 模式 ， 绘 制 函数 曲线 。 
4， 设置 图 形 中 曲线 和 标记 点 格式 
设置 图 形 中 的 线 宽 、 线 型 、 颜 色 和 标记 点 的 形状 、 大 小 、 颜 色 等 。 
5， 设置 坐标 轴 和 网 格 线 属性 
将 坐标 轴 的 范围 设置 在 指定 曲线 。 
6. 标注 图 形 
对 图 形 进行 标注 ， 包 括 在 图 形 中 添加 标题 、 坐 标 轴 标 注 、 文 字 标注 等 。 
7. 保存 和 导出 图 形 


按 指定 文件 格式 、 属 性 保存 或 导出 图 形 ， 以 备 后 续 使 用 。 
上 述 绘制 流程 中 ， 需 要 注意 以 下 两 点 
(1 ) 上 面 的 7 个 步骤 的 顺序 也 不 是 完全 固定 ,尤其 是 其 中 对 图 形 进行 修饰 标注 的 第 4、 
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5、6 步骤 ， 完 全 可 以 改变 顺序 。 

(2 )MATLAB 中 对 于 图 形 中 的 曲线 和 标记 点 格式 有 默认 的 设置 , 这 在 一 般 情况 下 是 可 
以 满足 使 用 者 需要 的 ， 因 此 对 于 只 是 想 大 概 查看 一 下 数据 分 布 的 用 户 ， 只 需要 进行 第 1 步 
和 第 3 步 工作 就 可 以 了 。 


_ 在 工作 空间 直接 绘图 


在 MATLAB 中 的 ， 还 有 一 种 较为 简单 的 绘图 方法 ， 就 是 直接 利用 工作 空间 的 数据 给 
出 想 要 的 图 形 。 这 种 方法 使 用 起 来 非常 简单 ， 只 需要 单 击 鼠标 选中 你 要 的 绘图 的 类 型 就 可 
以 了 。 

这 种 绘图 方法 的 基本 步骤 是 : 在 工作 空间 中 ， 首 先 用 鼠标 左 键 ， 选 中 要 绘制 图 形 的 数 
据 变 量 ， 看 到 变量 变 成 蓝 颜 色 后 ， 然 后 单 击 工作 空间 的 王 辣 按钮 ， 并且 选择 图 形 的 类 型 ， 
就 可 以 绘 出 想 要 的 图 形 了 。 

如 果 绘制 的 是 多 变量 数据 ， 使 用 Shift 键 全 部 选中 后 ， 再 单 击 绘图 图 表 的 图 形 类 别 ， 
就 可 以 了 。MATLAB 根据 变量 列 出 不 同 种 类 的 图 形 类 别 包 括 plot、bar、stem、stairs 、area、 
pie、hist 和 其 他 类 型 图 形 。 


【 例 3-1】 工作 空间 直接 作 图 法 使 用 实例 。 利 用 工作 空间 绘制 y*=sinx 正弦 曲线 。 
解 :在 命令 窗口 中 输入 以 下 命令 : 

x=-2*pi:pi/100:2*pi; 4 定义 x 的 范围 及 刻度 

Y=sin(x)， # 定 义 y 与 x 之 间 的 函数 关系 

运行 后 ， 在 工作 空间 中 将 生成 变量 x 和 》: 

在 工作 空间 中 ， 可 以 看 到 数据 名 、 数 据 类 型 、 数 据 最 小 值 和 数据 最 大 值 ， 然 后 鼠标 右 
键 单 击 变量 》, 则 数据 变 成 蓝 颜 色 ,如 果 此 时 不 选中 变量 x*, 直 接 单 击 ij 辣 后 ,选择 "plot(y)” 
便 可 绘制 图 形 。 操 作 界 面 及 绘制 的 图 形 如 3-1 所 示 。 








Eap 
ET mm 记 


ER 


cm 
ID 可 回电 1 二 三 芍 国 喝 到- 








图 3-1 )sin(o) 单 变量 工作 空间 图 形 


如 果 选 中 》 以 后 ， 按 住 Shift 键 ， 继 续 选中 x 后 ， 再 选择 plot(y) 便 可 绘制 图 形 。 操 作 界 
面 及 绘制 的 图 形 如 3-2 所 示 。 读 者 可 以 比较 出 两 图 的 差异 。 
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图 3-2 关 sin(9 双 变量 工作 空间 波形 图 


利用 绘图 函数 绘图 


MATLAB 提供 了 丰富 的 绘图 功能 ， 在 命令 窗口 中 输入 “help graph2d” 可 得 到 所 有 画 
二 维 图 形 的 命令 ; 输入 “help graph3d” 可 得 到 所 有 画 三 维 图 形 的 命令 。 


3.3.1 绘制 二 维 图 形 
二 维 图 形 的 基本 绘图 命令 是 ; 


plot (xl1，y1，option1，x2，yY2，option2，…) 


其 中 ，xl 与 y1 给 出 的 数据 分 别 为 x 轴 与 》 轴 坐 标 值 ，optionl 为 选项 参数 ， 以 逐 点 连 
折线 的 方式 绘制 1 个 二 维 图 形 ， 同 时 类 似 地 绘制 第 二 个 二 维 图 形 。 
这 是 plot 命令 的 完全 格式 ， 在 实际 应 用 中 可 以 根据 需要 进行 简化 。 


比如 plot(x, 、plot(x, y, option)， 选 项 参数 option 定义 了 图 形 曲 线 的 颜色 ( 用 颜色 英 
文 单词 的 第 一 个 字母 表示 ， 例 如 r 表示 红色 、g 表示 绿色 、b 表示 蓝 色 )、 线 型 ( 例如 #、* 
等 ) 及 标示 符号 ， 它 由 一 对 单 引 号 括 起 来 。 

【 例 3-2〗】 ”二 维 图 形 绘制 实例 。 利 用 plotx) 和 多 组 变量 的 语法 格式 分 别 绘制 当 
xef[0,2r] 时 ，y1=sin(x) 、y2=cos() 、73=sin(x 一 0.17D) 、 y4= cos(x+0.1r) 的 二 维 图 形 ， 
并 比较 单个 变量 图 形 和 多 组 变量 图 形 应 用 上 的 差异 。 

解 : 在 M 文件 编辑 器 中 输入 以 下 命令 : 


x=0:0.4*pi:2*piy s% 定 义 x 坐标 轴 范围 及 刻度 
yl1=sin(x)， & 定 义 Yl 与 x 函数 关系 

Y2=cos (x) ; % 定 义 yY2 与 x 函数 关系 
Y3=sin(x-0.1*pi) 7 s& 定 义 Y3 与 x 函数 关系 

Y4=cos (x+0.1*pi) 7 s 定 义 Y4 与 x 函数 关系 

plot (Y1) s% 绘 制 yl 与 x 函数 的 图 形 ， 如 图 3-3 


运行 以 上 M 代码 程序 ， 得 到 图 3-3 所 示 的 结果 图 形 。 
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图 3-3 ”plot(y1) 画 线 结果 


如 果 将 程序 中 plot(y1) 替 换 成 以 下 语句 ， 即 将 3 条 曲线 绘制 在 同一 图 中 ， 将 会 得 到 图 
3-4 所 示 结 果 图 形 。 


plot (x,y1,x,y2,x,yY3,x,y4) % 图 3-4， 注 意 比较 和 图 3-3 的 不 同 


了 4 玫 jeert Terlt Rahtog 于 md lp 
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图 3-4 对 多 组 数据 应 用 plot 画图 的 结果 


3.3.2 ”绘制 三 维 图 形 


1， 三 维 曲线 
MATLAB 也 提供 了 一 个 绘制 三 维 折线 或 曲线 的 基本 命令 plot3， 其 常用 的 格式 是 ; 
plot3 (xl1，y1，z1，option1，x2，y2，z2，option2，….) 
该 命令 中 : 
e 以 zl、y1、zl 所 给 出 的 数据 分 别 为 x、y、z 坐标 值 。 
。 optionl 为 选项 参数 ， 以 逐 点 连 折线 的 方式 绘制 1 个 三 维 折线 图 形 。 
以 友 、 冯 、 妈 所 给 出 的 数据 分 别 为 x、y、z 坐标 值 。 
。 option2 为 选项 参数 ， 以 逐 点 折线 的 方式 绘制 另 一 个 三 维 折线 图 形 。 
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需要 注意 的 是 : 

(1 ) plot3 命令 的 功能 及 使 用 方法 与 plot 命令 的 相 类 似 ， 它 们 的 区 别 在 于 前 者 绘制 出 的 
是 三 维 图 形 。 

( 2 ) plot3 命令 参数 的 含义 与 plot 命令 的 类 似 ， 它 们 的 区 别 在 于 前 者 多 了 一 个 z 方向 上 
的 参数 。 而 且 plot3 各 个 参数 的 取 值 情况 及 其 操作 效果 也 与 plot 命令 相同 。 上 面 给 出 的 plot3 
命令 格式 是 一 种 完整 的 格式 ， 在 实际 操作 中 ， 根 据 各 个 数据 的 取 值 情况 ， 可 以 有 下 述 一 种 
简单 的 书写 格式 : plot3(Cc，y，z) 或 plot3(x，y，z，option)o 

( 3 ) 选项 参数 option 指明 了 所 绘图 中 线条 的 线性 、 颜 色 以 及 各 个 数据 点 的 表示 
记号 。 

(4 ) plot3 命令 使 用 的 是 以 逐 点 连 线 的 方法 来 绘制 三 维 折线 的 ， 当 各 个 数据 点 的 间距 较 
小 时 ， 也 可 利用 它 来 绘制 三 维 曲线 。 

在 MATLAB 中 ， 除 了 可 以 绘制 三 维 曲线 以 外 ， 还 可 以 绘制 三 维 曲面 。 常 见 的 绘制 三 
维 曲面 的 MATLAB 函数 有 mesh 和 surf， 下 面 分 别 介绍 这 两 个 函数 的 用 法 。 
2. 三 维 网 格 曲面 

MATLAB 中 可 以 通过 mesh 函数 绘制 三 维 网 格 曲面 图 ,该 函数 的 常用 格式 有 以 下 几 种 : 

(1) mesh(X,7,Z,C) 

参数 X、Y、Z 都 为 矩阵 值 ， 参 数 C 表示 网 格 曲面 的 颜色 分 布 情 况 。 

(2 ) mesh(X,7,Z) 

参数 X、Y、Z 都 为 矩阵 值 ， 网 格 曲面 的 颜色 分 布 与 z 方向 上 的 高 度 值 成 正比 。 

(3 ) mesh(Cry,Z,C) 

参数 和 y 为 长 度 分 别 是 上 4 和 闫 向 量 ， 而 参数 乙 是 维 数 为 必 x 寻 的 矩阵 ， 参 数 C 表示 
网 格 曲面 的 颜色 分 布 情况 。 

(4) mesh(Cxy,Z) 

参数 * 和 为 长 度 分 别 是 上 和 闫 的 向 量 ， 而 参数 乙 是 维 数 为 由 xz 的 矩阵 ， 网 格 曲面 
的 颜色 分 布 与 z 方向 上 的 高 度 值 成 正比 。 

(5 ) mesh(Z,C) 

参数 Z 是 维 数 为 几 xn 的 矩阵 ， 参 数 C 表示 网 格 曲面 的 颜色 分 布 情况 。 

(6 ) mesh(Z) 

参数 民 是 维 数 为 mx 的 矩阵 ， 网 格 曲面 的 颜色 分 布 与 z 方向 上 的 高 度 值 成 正比 。 


3. 三 维 阴 影 曲面 
基本 的 三 维 阴影 曲面 绘制 采用 surf 函数 ， 调 用 这 种 函数 的 格式 有 以 下 几 种 。 


(1) surfQK.Y.Z,C) 
参数 X、Y、Z 都 为 矩阵 值 ， 参 数 C 表示 网 格 曲面 的 颜色 分 布 情况 。 
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(2) surfGf.Z.ZD) 

参数 X、Y、2Z 都 为 矩阵 值 ， 网 格 曲面 的 颜色 分 布 与 z 方向 上 的 高 度 值 成 正比 。 

(3 ) surfexy,Z,C) 

参数 x 和 y 为 长 度 分 别 是 半 和 闫 的 向 量 ， 而 参数 是 维 数 为 mxm 的 矩阵 ， 参数 C 表 
示 网 格 曲面 的 颜色 分 布 情况 。 

(4) surftry,Z) 

参数 和) 为 长 度 分 别 是 上 和 普 的 向 量 ， 而 参数 尺 是 维 数 为 站 xn 的 矩阵 ， 网 格 曲 面 
的 颜色 分 布 与 z 方向 上 的 高 度 值 成 正比 。 

(5) surf(Z,C) 

参数 Z 是 维 数 为 恬 xz 的 矩阵 ， 参 数 C 表示 网 格 曲面 的 颜色 分 布 情况 。 

(6) surf(Z) 

参数 民 是 维 数 为 必 x 的 矩阵 ， 网 格 曲面 的 颜色 分 布 与 z 方向 上 的 高 度 值 成 正比 。 

在 surf 命令 中 ， 各 个 四 边 形 表面 的 颜色 分 布 方式 可 由 shading 命令 来 指定 。 

。 shading faceted: 表示 截面 式 颜色 分 布 方式 。 

。 shading interp:， 表示 插 补 式 颜 色 分 布 方式 。 

。 shading flat， 表 示 平 面 式 颜 色 分 布 方式 。 

【 例 3-3】 三 维 曲线 绘制 函数 使 用 实例 。 利 用 plot3 函数 绘制 三 维 螺旋 线 。 其 中 y=sinf、 
)=cost，z=t，te[0,8r] > 
解 : 在 M 文件 编辑 器 中 输入 下 列 程序 代码 。 


t=0:pi/50:8*pii % 通 过 meshgrid 创建 网 格 数据 
x=sin(t); Y=cos(t);  z=ti % 定 义 x、Y、z 与 上 之 间 的 函数 关系 
plot3(x,y,2z) % 绘 制 x、y、z 三 维 图 形 


执行 该 程序 后 ， 显 示 结 果 如 图 3-5 所 示 。 
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图 3-5 ”三维 螺旋 线 图 形 
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【 例 3.4】 三维 网 格 曲面 图 绘制 应 用 实例 。 利 用 函数 mesh 在 和 卡尔 坐标 系 中 绘制 以 
， 2 
下 函数 的 网 格 曲面 图 ，/(x ))= SmCL 二 z) 。 














十 
解 : 在 M 文件 编辑 器 中 输入 下 列 程序 代码 。 
x=-8:0.5:87 s# 定 义 x 坐标 轴 范 围 及 刻度 
Y=x7 % 设 置 y 与 x 之 间 的 函数 关系 
[X,Y] =meshgrid(x,y)7 $% 设 置 矩形 网 络 
R=sqrt (X.^2+Y.^2)+epsi gs 函数 关系 
Z=sin(R) ./R7 s% 函 数 关系 
mesh (X,Y,Z) s% 绘 制 网 格 曲面 
grid on % 绘 制 网 格 


运行 以 上 程序 ， 得 到 函数 的 三 维 网 格 曲面 图 如 图 3-6 所 示 。 


Figare 1 
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图 3-6 三 维 网 格 曲面 图 


1 2 2 
【 例 3.5】 阴影 曲面 绘制 实例 。 利 用 surf 函数 绘制 三 维 函数 jx ) = 25iQGC 二 y 


大 十 史 

的 三 维 阴影 曲面 。 
解 : 在 M 文件 编辑 器 中 输入 以 下 程序 代码 。 

x=-8:0.5:8) s 定 义 x 坐标 轴 范 围 及 参数 

Y=xi % 定 义 Y 与 x 之 间 的 函数 关系 

[X,Y]=meshgriG(x,y) 7 4 设置 矩形 网 络 

R=sart (X.^2+Y.^2)+eps; s 设 置 函数 关系 

Z=2*sin(R) ./R7 $% 设 置 函 数 关系 

SurfE(X,Y,Z) s 绘 制 阴影 曲面 图 


保存 并 运行 该 程序 ， 显 示 结果 如 图 3-7 所 示 。 
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图 3-7 ”三维 阴影 曲面 
有 图形 的 修 针 


图 形 绘制 以 后 ， 需 要 对 图 形 进行 标注 、 说 明 等 修饰 性 的 处 理 ， 以 增加 图 的 可 读 性 ， 使 
之 能 反映 出 更 多 的 信息 。 可 以 利用 Figure 窗口 的 菜单 和 工具 栏 对 图 形 进行 标注 、 修 饰 等 ， 
操作 非常 简单 ， 请 参考 前 面 的 1.4.6 节 。 

此 外 ， 还 可 以 利用 MATLAB 自 带 的 函数 来 进行 图 形 的 修饰 。 


1. 选择 图 形 窗口 的 命令 

efigure 命令 : 打开 不 同 的 图 形 窗口 。 

figure(1)，figure(2); …;， figure(n)， 这 个 命令 用 来 打开 不 同 的 图 形 窗口 ， 以 便 绘 制 不 
同 的 图 形 。 

。 subplot 命令 ， 拆 分 图 形 窗口 。 

subplot(m, m, 记 : 分 割 图 形 显示 窗口 ，mm 表 示 上 下 分 割 个 数 ， 半 表示 左右 分 割 个 数 ，P 
表示 子 图 编号 。 


2 坐标 轴 相关 的 命令 
在 默认 情况 下 MATLAB 自动 选择 图 形 的 横 、 纵 坐标 的 比例 ， 当 然 也 可 以 用 axis 命令 
控制 ， 常 用 的 命令 介绍 如 下 。 
eaxis([xmin xmax ymin ymax]) ， [xmin xmax ymin ymax] 中 分 别 给 出 x 轴 和 y 轴 的 最 
大 值 、 最 小 值 。 
e axis equal: 大 轴 和 》 轴 的 单位 长 度 相 同 。 
e axis square: 图 框 呈 方 形 。 
。 axis off， 清 除 坐标 刻度 。 
在 某 些 应 用 中 , 还 会 用 到 半 对 数 坐标 轴 , MATLAB 中 常用 的 对 数 坐标 绘制 命令 介绍 如 下 。 
。 semilogx: 绘制 以 x 轴 为 对 数 坐标 ( 以 10 为 底 ) 》 轴 为 线性 坐标 的 半 对 数 坐 标 图 形 。 
esemilogy: 绘制 以 》 轴 为 对 数 坐 标 ( 以 10 为 底 和 x 轴 为 线性 坐标 的 半 对 数 坐 标 | 
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e loglog: 绘制 全 对 数 坐 标 绘图 ， 即 x*、y 轴 均 为 对 数 坐标 ( 以 10 为 底 ) 
3 文字 标示 命令 

常用 的 文字 标示 命令 介绍 如 下 。 

e text(x, y ' 字 符 串 ): 在 图 形 的 指定 坐标 位 置 (x, 处 标示 单 引 号 括 起 来 的 字符 串 。 

。 gtext(' 说 明文 字 ): 利用 鼠标 在 图 形 的 某 一 位 置 标示 说 明文 字 。 执 行 完 绘图 命令 后 再 
执行 gtext( 说 明文 字 ) 命令 ， 就 可 在 屏幕 上 得 到 一 个 光标 ， 然 后 用 鼠标 选择 放置 说 
明文 字 的 位 置 。 

e title( 字 符 串 )， 在 所 画图 形 的 最 上 端 显示 说 明 该 图 形 标题 的 字符 串 。 

e。 xlabel( 字 符 串 )、ylabel(' 字 符 串 ) 、zlabel( 字 符 串 )， 设置 x、》、z 坐标 轴 的 名 称 。 
输入 特殊 的 文字 需要 用 反 斜 杠 (\) 开头 。 

。 legend( 字 符 串 1, /字符 串 2，…, 字符 串 n): 在 屏幕 上 开启 一 个 小 视窗 ， 然后 依据 绘 
图 命令 的 先后 次 序 ， 用 对 应 的 字符 串 区 分 图 形 上 的 线 。 

4. 在 图 形 上 添加 或 删除 栅 格 命令 

常用 的 栅 格 操作 命令 介绍 如 下 。 

egrid: 给 图 形 加 上 栅 格 线 。 

egrid on， 给 当前 坐标 系 加 上 栅 格 线 。 

egrid off， 从 当前 坐标 系 中 删 去 栅 格 线 。 

。grid， 交 替 转 换 命令 ， 即 执行 一 次 ， 转 变 一 个 状态 ( 相当 于 grid on、grid o 企 )。 

5， 图形 保 持 或 覆盖 命令 

常用 的 图 形 保持 和 覆盖 的 命令 介绍 如 下 。 

。hold on; 把 当前 图 形 保持 在 屏幕 上 不 变 , 同时 允许 在 这 个 坐标 内 绘制 另外 一 个 图 形 。 

e hold off; 使 新 图 覆盖 旧 图 。 

hold; 此 命令 可 以 保持 当前 的 图 形 ， 并 且 防止 删除 和 修改 比例 尺 。hold 命令 是 一 


个 交替 转换 命令 ， 即 执行 一 次 ， 转 变 一 个 状态 ( 相当 于 交替 执行 hold on 和 hold 
off )。 

















活 S MATLAB 默认 hold 为 hold off， 这 时 的 操作 会 修改 图 形 的 属性 ， 因此 需要 在 
plot 之 前 加 上 hold on。 


6， 应 用 型 绘图 命令 
应 用 型 绘图 命令 常用 于 数值 统计 分 析 或 离散 数据 处 理 ， 常 用 的 应 用 型 绘图 命令 介绍 如 
下 。 
e box(x, ;绘制 对 应 于 输入 x 和 输出 的 高 度 条 形 图 。 
e histO, 妆 ;绘制 zx 在 以 为 中 心 的 区 间 中 分 布 的 个 数 条 形 图 。 
e stairs(x,); 绘制 》 对 应 于 x 的 梯形 图 。 
estemlx,y); 绘制 了 对 应 于 zx 的 散 上 
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注 宝 对 于 图 形 的 属性 同样 可 以 在 图 形 窗 口上 直接 编辑 ， 但 图 形 窗口 关闭 之 后 编辑 
结果 不 会 保存 。 


【 例 3-6】 
求 : 


绘图 命令 使 用 实例 。 绘 制 [0,4z] 区 间 上 的 xl=10sinf 和 x2-5cost 曲线 ， 并 要 


(1 ) xl 曲线 的 线形 为 点 画 线 、 颜 色 为 红色 、 数 据点 标记 为 加 号 ; xz 曲线 为 虚线 、 颜 


色 为 蓝 色 、 数 据点 标记 为 星 号 ; 





( 2 ) 标示 坐标 轴 的 显示 范围 和 刻度 线 、 添 加 栅 格 线 ; 
( 3 ) 标注 坐标 轴 名 称 、 标 题 、 相 应 文本 。 


: MATLAB 程序 代码 如 下 所 示 。 


close all $% 关 闭 打开 了 的 所 有 图 形 窗口 

clc 。% 清 屏 命令 

clear 。 % 清 除 工 作 空间 中 所 有 变量 

t=[0:pi/20:4*pi]; % 定 义 时 间 范 围 

hold on ”人 允许 在 同一 坐标 系 下 绘制 不 同 的 图 形 

axis([0 4*pi -10 10]) % 横 轴 范 围 [0,4n] ， 纵 轴 范 围 [-10,10] 

Plot tt，10*sin() ，'r+:') % 线 形 为 点 画 线 、 颜 色 为 红色 、 数 据点 标记 为 加 号 
plot (ft，5*cos (ct)，'b*--') % 线 形 为 虚线 、 颜 色 为 暑 色 、 数 据点 标记 为 星 号 
xlabel (' 时 间 *') ; ylabel(' 幅 值 x') 。 % 标 注 横 、 纵 坐标 轴 
titcle(' 简 单 绘图 实例 ' ) 添加 图 标题 

legend('x1l=10sint :点 画 线 '，'x2=5cost :虚线 ' ) 添加 文字 标注 
gtext('x1'); gtext('x2') % 利 用 也 标 在 图 形 标示 曲线 说 明文 字 

% 在 所 画 出 的 图 形 坐标 中 添加 栅 格 ， 注 意 用 在 plot 之 后 


运行 后 ， 输 出 结果 如 图 3-8 所 示 。 


griq on 








wx2 


2 4 6 8 10 12 
时 间 + 


图 3-8 【 例 3-6 】 的 输出 图 
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小 结 


MATLAB 具有 强大 的 数据 可 视 化 功能 , 可 以 方便 地 对 数据 进行 绘图 。 本 章 详细 讲解 了 
MATLAB 中 图 形 绘制 的 流程 、 函 数 、 工 具 、 图 形 修饰 的 方法 ， 以 及 特殊 坐标 轴 的 绘制 和 多 
种 特殊 绘图 函数 。 

本 章 的 例子 都 只 用 到 了 简单 的 绘图 函数 和 标注 函数 的 组 合 ， 都 是 绘图 中 最 基本 最 经 典 
的 实例 ， 读 者 都 应 该 仔细 阅读 体会 ， 最 好 实践 练习 。 
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在 MATLAB 中 ， 除 了 可 以 在 命令 窗口 中 输入 命令 逐 句 执行 外 ， 也 可 以 和 C、Fortran 
等 高 级 语言 一 样 编程 ， 称 为 M 文件 编程 。 

读者 首先 应 掌握 MATLAB 程序 设计 的 基本 方法 ， 不 断 实 践 ， 才 能 逐步 将 其 强大 的 功 
能 应 用 到 科学 计算 及 其 他 领域 的 学 习 和 应 用 中 去 。 


MATLAB 不 仅 是 一 种 功能 强大 的 高 级 语言 , 而 且 是 一 个 集成 的 交互 式 开发 环境 , 用 户 
可 以 通过 MATLAB 提供 的 编辑 调试 器 编写 和 调试 MATLAB 代码 。 

MATLAB 提供 了 代码 书写 和 调试 的 集成 开发 环境 ， 用 户 可 以 在 MATLAB 的 代码 编辑 
调试 器 中 完成 书写 和 调试 过 程 。 单 击 MATLAB 主 界面 的 “新 建 " 工具 按钮 或 者 单 击 "File” 
(文件 ) 菜单 “New”( 新 建 子 菜单 ) 的 “M-File” 项 ， 就 可 以 打开 MATLAB 代码 编辑 - 调 
试 器 ， 其 空白 界面 如 图 4-1 所 示 。 

用 户 也 可 以 在 命令 窗口 通过 edit filename 命令 打开 已 存在 的 M 文件 进行 编辑 调试 。 

从 图 4-1 可 见 ，MATLAB 能 够 根据 M 文件 内 容 区 别 所 打开 的 是 脚本 M 文件 还 是 函数 
M 文件 ， 并 且 在 整个 编辑 过 程 中 追踪 光标 位 置 ( 如 图 4-1 底部 的 “Ln 1 Col 1" 表示 当前 光 
标 处 在 第 一 行 的 第 一 列 )， 这 对 于 快速 准确 地 定位 当前 编辑 和 修改 位 置 是 很 方便 有 用 的 。 

开发 MATLAB 程序 一 般 需 要 经 历代 码 编写 、 调 试 、 优 化 几 个 阶段 。 

在 编写 代码 时 ， 要 及 时 保存 阶段 性 成 果 ， 可 以 通过 “File” 菜单 的 “Save” 项 或 者 “ 保 
存 ” 按 钮 保存 当前 M 文件 。 

完成 代码 书写 之 后 ， 要 试 运行 代码 看 看 有 没有 运行 错误 ， 然 后 根据 针对 性 的 错误 提示 
对 程序 进行 修改 。 
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图 4-1 MATLAB 代码 编辑 -调试 器 
运行 脚本 M 文件 , 只 需要 在 命令 窗口 中 输入 其 文件 名 , 然后 按 回 车 键 , 或 通过 "Debug" 
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菜单 的 “Save file and Run” 项 ， 或 按 快捷 键 “F5” 完 成 。 

函数 M 文件 需要 在 命令 窗口 传递 输入 参数 才能 调用 。 除 了 一 些 很 简单 的 代码 ， 大 部 
分 情况 下 用 户 都 可 能 遇 到 程序 报错 的 问题 ， 这 就 需要 对 代码 进行 调试 纠 错 ， 一 般 需 要 通过 
“Debug” 菜 单 下 的 子 项 辅助 完成 ， 包 括 设置 断 点 、 逐 步 运行 等 项 。 

当 程序 运行 无 误 后 ， 还 要 考虑 程序 性 能 是 否 可 以 改进 。MATILAB 提供 了 M-Lint 和 
Profiler 工具 ， 能 够 辅助 用 户 分 析 代码 运行 中 时 间 消 耗 的 细节 和 可 能 需要 改变 的 编程 细节 ， 
比如 循环 赋值 前 没有 预定 义 数组 ， 用 循环 去 实现 可 以 用 数组 函数 实现 的 运算 等 。 这 些 工 具 
都 在 “Tools” 菜 单 下 设置 了 子 菜单 。 





_MATLAB 程序 设计 原则 


MATLAB 程序 的 基本 设计 原则 如 下 所 述 。 

(1 ) 百 分 号 “%” 后 面 的 内 容 是 程序 的 注解 ， 要 善于 运用 注解 使 程序 更 具 可 读 性 。 

( 2 ) 养 成 在 主 程序 开头 用 clear 指令 清除 变量 的 习惯 ， 以 消除 工作 空间 中 其 他 变量 对 
程序 运行 的 影响 ， 但 注意 在 子 程序 中 不 要 用 clearo 

( 3 ) 参数 值 要 集中 放 在 程序 的 开始 部 分 ， 以 便 维护 。 要 充分 利用 MATLAB 工具 箱 提 
供 的 指令 来 执行 所 要 进行 的 运算 ， 在 语句 行 之 后 输入 分 号 使 其 及 中 间 结 果 不 在 屏幕 上 显 
示 ， 以 提高 执行 速度 。 

( 4 ) input 指令 可 以 用 来 输入 一 些 临时 的 数据 ; 而 对 于 大 量 参数 ， 则 建立 一 个 存储 参数 
的 子 程序 ， 在 主 程序 中 通过 子 程序 的 名 称 来 调用 。 

( 5 ) 程序 尽量 模块 化 ， 即 采用 主 程序 调用 子 程序 的 方法 ， 将 所 有 子 程序 合并 在 一 起 来 
执行 全 部 的 操作 。 

( 6 ) 充分 利用 Debugger 来 进行 程序 的 调试 ( 设置 断 点 、 单 步 执行 、 连 续 执行 )， 并 利 
用 其 他 工具 箱 或 图 形 用户 界 面 ( GUI ) 的 设计 技巧 ， 将 设计 结果 集成 到 一 起 。 

(7 ) 设置 好 MATLAB 的 工作 路 径 ， 以 便 程序 运行 。 

( 8 ) MATLAB 程序 的 基本 组 成 结构 如 下 所 示 。 

MATLAB 程序 的 基本 组 成 结构 





儿 说 明 

清除 命令 ， 清 除 workspace 中 的 变量 和 图 形 ( clearclose | 

定义 变量 : 包括 全 局 变量 的 声明 及 参数 值 的 设 定 。 

逐 行 执行 命令 ， 指 MATLAB 提供 的 运算 指令 或 工具 箱 提供 的 专用 命令 。 


控制 循环 : 包含 for，if then，switch，while 等 语句 。 
逐 行 执行 命令 。 


end 
给 图 命令 : 将 运算 结果 绘制 出 来 。 
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当然 ， 更 复杂 的 程序 还 需要 调用 子 程序 ， 或 与 其 他 应 用 程序 相 结合 。 


5 w 文件 


M 文件 是 包含 MATLAB 代码 的 文件 。 


1，M 文件 的 类 型 

M 文件 按 其 内 容 和 功能 可 以 分 为 脚本 M 文件 和 函数 M 文件 两 大 类 。 

(1) 脚本 M 文件 

它 是 许多 MATLAB 代码 按 顺 序 组 成 的 命令 序列 集合 ， 不 接受 参数 的 输入 和 输出 ， 与 
MATLAB 工作 空间 共享 变量 空间 。 

它 一 般 用 来 实现 一 个 相对 独立 的 功能 ， 比 如 对 某 个 数据 集 进行 某 种 分 析 、 绘 图 ， 求 解 
某 个 已 知 条 件 下 的 微分 方程 等 。 用户 可 以 通过 在 命令 窗口 中 直接 输入 文件 名 来 运行 脚本 M 
文件 。 

通过 脚本 M 文件 ， 用 户 可 以 把 为 实现 一 个 具体 功能 的 一 系列 MATLAB 代码 写 在 一 个 
M 文件 中 ， 每 次 只 需要 输入 文件 名 即 可 运行 脚本 M 文件 中 的 所 有 代码 。 

(2) 函数 M 文件 

它 也 是 实现 一 个 单独 功能 的 代码 块 ， 但 与 脚本 M 文件 不 同 的 是 ， 函 数 M 文件 需要 接 
受 参数 输入 和 输出 ， 函 数 M 文件 中 的 代码 一 般 只 处 理 输入 参数 传递 的 数据 ， 并 把 处 理 结 
果 作 为 函数 输出 参数 返回 给 MATLAB 工作 空间 中 的 指定 接收 变量 。 

因此 ， 函 数 M 文件 具有 独立 的 内 部 变量 空间 。 在 执行 函数 M 文件 时 ， 要 指定 输入 参 
数 的 实际 值 ， 而 且 一 般 要 指定 接收 输出 结果 的 工作 空间 变量 。 

MATLAB 提供 的 许多 函数 就 是 用 函数 M 文件 编写 的 ， 尤 其 是 各 种 工具 箱 中 的 函数 ， 
用 户 可 以 打开 这 些 M 文件 来 查看 。 实 际 上 ， 对 于 特殊 应 用 领域 的 用 户 ， 如 果 积 累 了 足够 
多 的 专业 领域 应 用 的 函数 ， 就 可 以 组 建 自己 的 专业 领域 工具 箱 了 。 

通过 函数 M 文件 ,用户 可 以 把 实现 一 个 抽象 功能 的 MATLAB 代码 封装 成 一 个 函数 接 
口 ， 在 以 后 的 应 用 中 重复 调用 。 


2.，M 文件 的 结构 

图 4-2 显示 的 是 MATLAB 提供 的 一 个 函数 M 文件 的 全 部 内 容 ， 图 中 清楚 地 显示 了 一 
般 的 M 文件 包括 的 各 部 分 结构 。 

从 图 4-2 可 以 看 到 ，MATLAB 中 M 文件 一 般 包 括 以 下 5 部 分 结构 。 

(1 ) 函数 声明 行 ( Function Definition Line )。 这 一 行 只 出 现在 函数 M 文件 的 第 一 行 ， 
通过 function 关键 字 表 明 此 文件 是 一 个 函数 M 文件 ,并 指定 函数 名 、 输 入 和 输出 参数 ， 如 
4-2 中 的 第 1 行 所 示 。 

(2 ) HI 行 。 这 是 帮助 文字 的 第 一 行 ( the first help text line )， 给 出 M 文件 帮助 最 关键 
的 信息 。 当 用 lookfor 查找 与 某 个 单词 相关 的 函数 时 , lookfor 只 在 HI 行 中 搜索 是 否 出 现 指 
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定单 词 ， 如 图 4-2 中 的 第 2 行 所 示 。 
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图 4-2 ”M 文件 的 一 般 结构 


(3 ) 帮助 文字 。 这 部 分 对 M 文件 有 更 加 详细 的 说 明 ， 解 释 M 文件 实现 的 功能 ，M 文 
件 中 出 现 的 各 变量 、 参 数 的 意义 ， 以 及 创作 版 权 信息 等 , 如 图 4-2 中 的 第 13 行 所 示 。 当 获 
取 一 个 M 文件 的 帮助 时 ，H1 行 和 帮助 文字 部 分 同时 显示 。 

(4) M 文件 正文 。 这 是 M 文件 实现 功能 的 MATLAB 代码 部 分 ， 通 常 包 括 运算 、 赋 值 
等 指令 。 图 4-2 的 例子 中 只 有 第 16 行 ， 但 一 般 M 文件 正文 都 由 多 行 代码 组 成 。 

( 5 ) 注释 部 分 。 这 部 分 出 现 的 位 置 比较 灵活 ， 主 要 是 用 来 注释 M 文件 正文 的 具体 运 
行 过 程 ， 以 方便 阅读 和 修改 ， 经 常 穿插 在 M 文件 正文 中 间 。 

图 4-2 的 例子 中 的 第 15 行 就 是 注释 说 明正 文 第 16 行 的 意义 。 注 释 一 般 都 是 针对 接 下 
来 的 一 段 正文 代码 的 ，M 文件 中 也 经 常 包 括 多 行 注释 。 
3，M 文件 的 创建 

虽然 一 般 脚本 M 文件 可 以 包括 上 述 5 部 分 结构 中 除去 “函数 声明 行 ”以 外 的 4 部 分 ， 
但 在 实际 应 用 中 ， 脚 本 M 文件 经 常 仅仅 由 M 文件 正文 和 注释 部 分 构成 。 正 文部 分 实现 功 
能 ， 注 释 部 分 则 给 出 每 一 块 代码 的 功能 说 明 。 下 面 通过 实例 讲述 脚本 M 文件 的 创建 。 

【 例 4-1】  M 文件 创建 实例 。 建 立 一 个 命令 文件 ， 将 变量 g，b 的 值 互 换 。 
解 : 首先 打开 M 文件 编辑 器 ， 输 入 以 下 程序 。 


b=[11,12,13;14,15,16;17,18,19] 7? 
a=b; b=c; 






然后 保存 文件 名 为 “41.m” 即 完成 了 文件 的 创建 。 
在 MATLAB 的 命令 窗口 中 输入 “41”， 将 会 执行 该 命令 文件 。 


>> 41 
己 = 11 12 13 
14 了 5 16 
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1I7 18 19 

b=-1 2 3 45 6 7 8 9 

函数 M 文件 的 命名 一 般 和 函数 名 一 致 , 比如 图 4-2 中 函数 声明 行 function t=now0， 表 
明 函 数 名 为 now, 因此 此 函数 M 文件 一 般 保存 为 now.m, 可 以 通过 now0 语 句 调用 该 文件 ; 
如 果 函 数 名 和 文件 名 不 一 致 ， 函 数 调用 就 需要 通过 文件 名 和 与 函数 声明 中 对 应 的 参数 列表 
来 实现 。 

编写 好 的 函数 M 文件 ， 相 当 于 MATLAB 提供 的 命令 ， 可 以 在 命令 行进 行 函数 调用 。 
但 要 注意 ， 要 求 被 调用 的 函数 对 应 的 .m 文件 必须 在 MATLAB 路 径 下 。 


_MATLAB 程序 流程 控制 


和 各 种 常见 的 高 级 语言 一 样 ，MATLAB 也 提供 了 多 种 经 典 的 程序 结构 控制 语句 。 
MATLAB 中 的 程序 流程 控制 语句 有 : 分 支 控制 语句 ( 应 结构 和 switch 结构 )、 循 环 控制 语 
句 (for 循环 、while 循环 、continue 语句 和 break 语句 ) 和 程序 终止 语句 ( retum 语句 )， 
下 面 分 别 进行 介绍 。 


1. 分 支 控 制 语 名 
分 支 控制 语句 可 以 使 程序 中 的 一 段 代 码 只 在 满足 一 定 条 件 时 才 执 行 ， 因 此 也 称 为 分 支 
选择 。MATLAB 中 分 支 语句 有 两 类 : 证 语句 和 switch 语句 。 
。 让 与 else 或 elseif 连用 ， 偏 向 于 是 非 选 择 ， 当 某 个 逻辑 条 件 满 足 时 就 执行 这 后 的 语 
句 ， 和 否则 执行 else 语句 。 
。 switch 和 case、otherwise 连用 ， 偏 向 于 情况 的 列举 ， 当 表达 式 结果 为 某 个 或 某 些 值 
时 ， 执 行 特定 case 指定 的 语句 段 ， 否 则 执行 otherwise 语句 。 
这 结构 的 语法 形式 如 下 所 示 ; 
if logical_expression 
statements 
elseif logical_expression 
StatementSs 
else logical_expression 


statements 
end 


其 中 elseif 和 else 语句 都 是 可 选 语 句 。if、elseif 和 else 构成 的 各 项 分 支 里 面 ， 哪 个 的 
条 件 满 足 ( 逻辑 表达 式 logical_expression 的 结果 为 真 ) ， 就 执行 哪个 分 支 后 面 紧 跟 的 程序 
语句 。 因 此 ， 各 个 分 支 条 件 满足 的 情况 应 该 是 互 斥 的 和 完全 的 ， 就 是 被 选 的 条 件 在 一 个 分 
支 中 成 立 ， 而 且 只 能 在 一 个 分 支 中 成 立 。 当 然 ， 省 略 了 elseif 和 else 分 支 的 语句 ， 就 不 必要 
求 分 支 条 件 满足 的 情况 具备 完全 性 了 。 

放 结构 中 条 件 判 断 除了 可 以 用 罗 辑 表达 式 外 ， 还 可 以 用 数组 4， 这 时 判断 相当 于 逻辑 
表达 式 all(4)， 即 当 数组 4 的 所 有 元 素 都 为 非 零 值 时 ， 才 执行 该 条 件 后 的 分 支 代码 。 

特别 地 ， 当 数组 4 为 空 数组 时 ， 相 当 于 该 条 件 判 断 为 假 。 
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switch 结构 的 语法 形式 如 下 所 示 : 





switch expression (scalar or string) 
case valuel 


Statements 8 Executes if expression is valuel 
case value2 

statements 8 Executes if expression is value2 
Otherwise 

StacementsS 多 Executes if expression does not 


s match any case 
ena 


执行 中 ， 先 计算 表达 式 expression 的 值 ， 当 结果 等 于 某 个 case 的 value 时 ， 就 执行 该 
case 紧 随 的 语句 。 如 果 所 有 case 的 value 都 和 expression 计算 结果 不 相等 , 则 执行 otherwise 
后 面 紧 随 的 语句 。 

otherwise 语句 是 可 选 的 ， 当 没 有 otherwise 语句 时 ， 如 果 所 有 case 的 value 都 和 
expression 计算 结果 不 相等 ， 则 跳 过 switch-case 语句 段 ， 直 接 执行 后 续 代码 。 

相等 的 意义 ， 对 于 数值 类 型 来 说 ， 相 当 于 判断 “if result 一 value"， 对 于 字符 串 类 型 来 
说 ， 相 当 于 判断 “if strcmp(resulbvalue) "。 

由 此 可 见 ，switch-case 语句 实际 上 可 以 被 计 elseif-else 语句 等 效 替换 ， 不 过 两 种 结构 
各 有 更 便利 的 地 方 ， 读 者 在 以 后 的 例子 中 会 逐渐 体会 到 。 

学 过 C 语言 的 读者 需要 注意 ，MATLAB 中 的 switch-case 结构 ， 只 执行 表达 式 结果 匹 
配 的 第 一 个 case 分 支 ， 然 后 就 跳出 switch-case 结构 。 因 此 ， 不 需要 在 每 一 个 case 语句 中 
用 break 语句 跳出 。 

在 一 条 case 语句 后 可 以 列举 多 个 值 ， 只 需要 以 元 胞 数组 的 形式 列举 多 个 值 ， 就 是 用 花 
括号 把 由 逗号 或 空格 分 隔 的 多 个 值 括 起 来 即 可 。 


2， 循环 控制 语句 

循环 控制 语句 能 够 使 得 某 段 程序 代码 多 次 重复 执行 ，MATLAB 中 提供 了 两 类 循环 语 
分 别 是 for 循环 和 while 循环 : 

。 for 循环 一 般 用 于 已 知 循环 执行 次 数 的 情况 。 

e while 循环 则 用 于 已 知 循环 退出 条 件 的 情况 。 

MATLAB 还 提供 了 continue 和 break 语句 ， 用 于 更 精细 地 控制 循环 结构 : 
e continue 语句 使 得 当前 次 循环 不 向 下 执行 ， 直 接 进入 下 一 次 循环 。 

。 break 语句 则 表示 退出 该 循环 。 

(1 ) for 循环 

for 循环 用 于 知道 循环 次 数 的 情况 ， 其 语法 格式 如 下 所 示 : 

for index = start:increment:end 


statements 
ena 


名 
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其 中 ，index 为 循环 变量 ，increment 为 增 量 ，end 用 于 判断 循环 是 否 应 该 终止 。 增 量 
increment 默认 值 为 1， 可 以 自由 设置 ; 当 增 量 为 正 数 时 ， 循 环 开始 先 将 index 赋值 为 start， 
然后 判断 index 是 否 小 于 或 等 于 end。 若 是 ， 则 执行 循环 语句 ， 执 行 完 后 ， 对 index 累加 一 
个 增 量 increment;， 再 判断 index 是 否 小 于 或 等 于 end， 若 是 ， 则 继续 执行 循环 语句 ， 继 续 
对 index 累加 ， 循 环 往复 ， 直 到 index 大 于 end 时 退出 循环 。 

增 量 increment 也 可 以 设置 为 负 整数 ,表示 每 次 循环 执行 后 对 循环 变量 index 进行 递减 ， 
当 index 小 于 end 时 ， 退 出 循环 。 

MATLAB 中 , 循环 的 执行 效率 很 低 , 提高 程序 效率 的 一 个 办 法 就 是 多 采用 数组 结构 和 
MATLAB 内 联 函数 。 

for 循环 中 的 循环 变量 index 也 可 以 赋值 为 数组 4， 那么 在 第 一 次 循环 中 index 就 被 赋 
值 为 4(:,D)， 即 4 的 第 一 列 元 素 ， 第 二 次 循环 index 被 赋值 为 4(:,2)， 以 此 类 推 ; 若 4 有 
列 元 素 ， 则 循环 执行 呈 次 ， 第 二 次 循环 时 ， 循 环 变量 index 被 冉 值 为 4(:m)。 

(2) while 循环 

while 循环 用 于 已 知 循环 退出 条 件 的 情况 ， 其 语法 形式 如 下 所 示 : 


while expression 
statements 
end 


当 表 达 式 expression 的 结果 为 真 时 ， 就 执行 循环 语句 ， 直 到 表达 式 expression 的 结果 
为 假 ， 才 退出 循环 。 

如 果 表 达 式 expression 是 一 个 数组 4， 则 相当 于 判断 all(4)。 特 别 地 ， 空 数组 则 被 当 作 
逻辑 假 ， 循 环 停止 。 

(3 ) continue 语句 

continue 语句 用 在 循环 中 ， 表 示 当 前 循环 不 再 继续 向 下 执行 ， 而 是 直接 对 循环 变量 进 
行 递 增 ， 进 入 下 一 次 循环 。 

(4 ) break 语句 

break 语句 用 于 退出 循环 。 


3. 程序 终止 语句 


一 般 程序 代码 都 是 按 流程 执行 完毕 后 正常 退出 ， 但 当 遇 到 某 些 特殊 情况 ， 程 序 需要 立 
即 退 出 时 ， 就 可 以 用 retum 语句 提前 终止 程序 运行 。 


【 例 4-2】 retumn 语句 使 用 实例 。 


clear 

clc 

mn=-27 

if n<0 
Qisp('negative number!') 7 
returni 

end 
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Gisp('codon after return') 


本 例 中 当 变量 取 值 为 负数 时 ， 通 过 return 直接 退出 ， 不 执行 证 后 的 代码 。 其 运行 结 
果 是 : 





negative number'! 
若 去 掉 其 中 的 return 语句 ， 则 运行 结果 变 为 ; 


negative numberl 
codon after return 


return 语句 更 多 地 用 在 MATLAB 函数 M 文件 中 。 
_MATLAB 中 的 函数 及 调用 


4.5.1 ”函数 类 型 


MATLAB 中 的 函数 可 以 分 为 匿名 函数 、M 文件 主 函数 、 艇 套 函 数 、 子 函数 、 私 有 函 
数 和 重 载 函数 。 


1， 匿名 函数 

匿名 函数 通常 是 很 简单 的 函数 ， 它 是 面向 命令 行 代码 的 函数 ， 通 常 只 由 一 句 很 简单 的 
声明 语句 组 成 。 

匿名 函数 也 可 以 接受 多 个 输入 和 输出 参数 。 使 用 匿名 函数 的 优点 是 不 需要 维护 一 个 M 
文件 ， 而 只 需要 一 句 非常 简单 的 语句 ， 就 可 以 在 命令 窗口 或 M 文件 中 调用 函数 ， 这 对 于 
那些 函数 内 容 非 常 简单 的 情况 是 很 方便 的 。 

创建 匿名 函数 的 标准 格式 如 下 所 示 : 


fhandle = @(arglist) expr 


(1 ) expr 通常 是 一 个 简单 的 MATLAB 变量 表达 式 ， 实 现 函 数 的 功能 ， 比 如 x+x.^2、 
sin(x).*cos(o) 等 。 

(2 ) arglist 是 参数 列表 ， 它 指定 函数 的 输入 参数 列表 ， 对 于 多 个 输入 参数 的 情况 ， 通 
常 要 用 逗号 分 隔 各 个 参数 。 

(3 ) 符号 “@" 是 MATLAB 中 创建 函数 句柄 的 操作 符 ， 表 示 对 由 输入 参数 列表 arglist 
和 表达 式 expr 确定 的 函数 创建 句柄 ， 并 把 这 个 函数 句柄 返回 给 变量 fhandle， 这 样 ， 以 后 
就 可 以 通过 fhandle 来 调用 定义 好 的 这 个 函数 。 

例如 ， 定 义 函数 ， 

myfunhd=@ (x) (x+x. .^2) 


表示 创建 了 一 个 匿名 函数 ， 它 有 一 个 输入 参数 x， 它 实现 的 功能 是 x+x^2， 并 把 这 个 
函数 句柄 保存 在 变量 myfunhd 中 , 以 后 就 可 以 通过 myfunhd(a) 来 计算 当 xz=a 的 时 候 的 函数 
值 。 
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需要 注意 的 是 ， 匿 名 函数 的 参数 列表 arglist 中 可 以 包含 一 个 参数 或 多 个 参数 ， 这 样 调 
用 的 时 候 就 要 按 顺 序 给 出 这 些 参数 的 实际 取 值 。 

但 arglist 也 可 以 不 包含 参数 ， 即 留 空 ， 这 种 情况 下 函数 时 还 是 需要 通过 fhandle0 的 形 
式 来 调用 ， 即 要 在 函数 句柄 后 紧 跟 一 个 空 的 括号 。 否 则 ， 只 显示 fhandle 句柄 对 应 的 函数 
形式 。 

匿名 函数 可 以 嵌 套 ， 即 在 expr 表 达 式 中 可 以 用 函数 来 调用 一 个 匿名 函数 句柄 。 

【 例 4-3】〗】 。 芽 名 函数 创建 实例 。 


>> myfhdl=@(x) (x+x.^2) 


myfhdl = 8@(x) (x+x.^2) 

>> myfhal(2) 

ans = 6 

>> myfhd2=@(x,y) (sin(x)+cos(y)) 

myfhd2 = @(x,y) (sin{x)+cos(y)) 

>> myfhd2(pi/2,pi/6) 

ans 三 1.8660 

>> myfhd3=8@() (3+2) 

myfhda = 8@() (3+2) 

>> myfhd3 () 

ans = 介 

>> myfhd3 

myfhdd = 8@()(3+2) 

>> myffhd=e@(a) (quad(e(x) (a.*x.^2+1./a.*x+l./a^2),0,1)) % 匿 名 函数 代 套 使 用 
myffhd = 8@(a) (quad(@(x) (a.*x.^2+1./a.wx+1./a^2),0,I)) 
>> myffhd(0.5) 

ans = ”5.1667 


匿名 函数 可 以 保存 在 .mat 文件 中 ， 上 例 中 就 可 以 通过 “save myfunquad.mat myffhd" 
把 匿名 函数 句柄 myffhd 保存 在 myfunquad.mat 文件 中 , 以 后 需要 用 到 匿名 函数 myffhd 时 ， 
只 需要 使 用 语句 “load myfunquad.mat myffhd” 就 可 以 了 。 
2，M 文件 主 函数 

每 一 个 函数 M 文件 第 一 行 定义 的 函数 就 是 M 文件 主 函数 , 一 个 M 文件 只 能 包含 一 个 
主 函 数 ， 并 通常 习惯 上 将 M 文件 名 和 M 文件 主 函 数 名 设 为 一 致 。 

M 文件 主 函数 的 说 法 是 针对 其 内 部 钳 套 函数 和 子 函数 而 言 的 。 一 个 M 文件 中 除了 一 
个 主 函 数 外 ， 还 可 以 编写 多 个 嵌 套 函数 或 子 函数 ， 以 便 在 主 函 数 功能 实现 中 进行 调用 。 
3， 媒 套 函 数 

在 一 个 函数 内 部 ， 可 以 定义 一 个 或 多 个 函数 ， 这 种 定义 在 其 他 函数 内 部 的 函数 就 被 称 
为 驹 套 函 数 。 侯 套 可 以 多 层 发 生 ， 就 是 说 一 个 函数 内 部 可 以 合 套 多 个 函数 ， 这 些 伐 套 函 数 
内 部 又 可 以 继续 从 套 其 他 函数 。 

伐 套 函数 的 语法 格式 如 下 所 示 : 


function x = At(Pp1，P2) 
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function y = B{p3) 





ena 
ena 
一 般 函 数 代码 中 结尾 是 不 需要 专门 标明 “end” 的 ， 但 在 使 用 九 套 函数 时 ， 无 论 妃 套 
函数 还 是 伐 套 函数 的 父 函 数 ( 直接 上 一 层 函数 ) 都 要 明确 标 出 “end” 表 示 函 数 结束 。 
嵌 套 函数 的 互相 调用 需要 特别 注意 , 这 和 九 套 的 层次 密切 相关 , 如 在 下 面 一 段 代码 中 
function A(x，Y) 。 $# 外 层 函 数 A ( 例如 主 函数 ) 
B(x，Y) 7 
DYy) 
function B(x，y) %R 的 例 套 函数 ( 以 A 为 参照 可 以 称 为 第 一 层 馈 套 函数 ) B 的 父 函 数 为 入 
Ctx) 7 
Dty); 
function C(x) $3 的 嫩 套 函数 ( 以 A 为 参照 可 以 称 为 第 二 层 嵌 套 函数 ) C 的 父 函 数 为 也 
D(x); 
end 
ena 
function D(x) 4A 的 钳 奔 函数 ( 以 R 为 参照 可 以 称 为 第 一 层 侈 套 函 数 ) D 的 父 函 数 为 A 
已 (x) 7 
function E(x) %D 的 镶 套 函数 ( 以 A 为 参照 可 以 称 为 第 二 层 代 套 函数 ) E 的 父 函 数 为 D 
ena 
ena 
end 
(1 ) 外 层 的 函数 可 以 调用 向 内 一 层 直接 嵌 套 的 函数 ( A 可 以 调用 B 和 D ) ， 而 不 能 调 
用 更 深层 的 伐 套 函数 ( A 不 可 以 调用 C 或 E) 。 
( 2 ) 散 套 函数 可 以 调用 与 自己 具有 相同 父 函 数 的 其 他 同 层 媒 套 函 数 ( B 和 D 可 以 互相 
调用 )o 
(3 ) 嵌 套 函数 也 可 以 调用 其 父 函 数 或 与 父 函 数 具有 相同 父 函 数 的 其 他 嵌 套 函数 C 可 以 
调用 B 和 D )， 但 不 能 调用 与 其 父 函 数 具 有 相同 父 函数 的 其 他 黎 套 函数 内 深层 侈 套 的 函数 。 


4. 子 函数 

一 个 M 文件 只 能 包含 一 个 主 函数 ， 但 一 个 M 文件 中 可 以 包含 多 个 函数 ， 这 些 编写 在 
主 函 数 后 的 函数 都 称 为 子 函数 。 所 有 子 函数 只 能 被 其 所 在 M 文件 中 的 主 函数 或 其 他 子 函 
数 调用 。 

所 有 子 函 数 都 有 自己 独立 的 声明 和 帮助 、 注 释 等 结构 ， 只 需要 在 位 置 上 处 在 主 函数 之 
后 即 可 ， 而 各 个 子 函数 的 前 后 顺序 都 可 以 任意 放置 ， 和 被 调用 的 前 后 顺序 无 关 。 

M 文件 内 部 发 生 函 数 调用 时 ，MATLAB 首先 检查 该 M 文件 中 是 否 存在 相应 名 称 的 子 
函数 ， 然 后 检查 这 一 M 文件 所 在 目录 的 子 目录 下 是 否 存在 同名 的 私有 函数 ， 然后 按照 
MATLAB 路 径 检查 是 否 存在 同名 的 M 文件 或 内 部 函数 。 

根据 这 一 顺序 ， 函 数 调用 时 首先 查找 相应 的 子 函数 ， 因 此 ， 可 以 通过 编写 同名 子 函 数 
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的 方法 实现 M 文件 内 部 的 函数 重 载 。 

子 函 数 的 帮助 文件 也 可 以 通过 help 命令 显示 ， 如 myfunm 文件 中 有 名 为 myfun 的 主 
函数 和 名 为 mysubfun 的 子 函 数 ， 那 么 可 以 通过 help myfun>mysubfun 命令 来 获取 子 函 数 
mysubfun 的 帮助 。 


5， 私 有 函数 

私有 函数 是 具有 限制 性 访问 权限 的 函数 , 它们 对 应 的 M 文件 需要 保存 在 名 为 “private” 
的 文件 夹 下 , 这 些 私 有 函数 代码 在 编写 上 和 普通 的 函数 没有 什么 区 别 ， 也 可 以 在 一 个 M 文 
件 中 编写 一 个 主 函数 和 多 个 子 函 数 ， 以 及 徐 套 函数 。 

私有 函数 只 能 被 private 目录 的 直接 父 目 录 下 的 脚本 M 文件 或 M 文件 主 函 数 调用 。 通 
过 help 命令 获取 私有 函数 的 帮助 ， 也 需要 声明 其 私有 特点 ， 例 如 要 获取 私有 函数 myprifun 
的 帮助 ， 就 要 使 用 help private/myprivfun 命令 。 


6. 重 载 函数 

" 重 载 ”是 计算 机 编程 中 非常 重要 的 概念 ， 它 经 常用 在 处 理 功能 类 似 但 参数 类 型 或 个 
数 不 同 的 函数 编写 中 。 

例如 现在 要 实现 一 个 计算 功能 ， 一 种 情况 是 输入 的 几 个 参数 都 是 双 精度 浮 点 类 型 ， 同 
时 也 有 一 种 情况 是 ， 输 入 的 几 个 参数 都 是 整 型 变量 ， 这 时 候 ， 用 户 就 可 以 编写 两 个 同名 函 
数 ， 一 个 用 来 处 理 双 精 度 浮 点 类 型 的 输入 参数 ， 另 一 个 用 来 处 理 整 型 的 输入 参数 ， 这 样 ， 
当 用 户 实际 调用 函数 时 ，MATLAB 就 会 根据 实际 传递 的 变量 类 型 选择 执行 其 中 一 个 函数 。 

MATLAB 中 重 载 函数 通常 放置 在 不 同 的 文件 夹 下 , 通常 文件 夹 名 称 以 符号 @ 开 头 ， 然 
后 跟 一 个 代表 MATLAB 数据 类 型 的 字符 。 

例如 “@double” 目 录 下 的 重 载 函数 的 输入 参数 应 该 是 双 精 度 浮 点 型 ， 而 “@int32" 
目录 下 的 重 载 函数 的 输入 参数 应 该 是 32 位 整 型 。 


4.5.2 ”函数 参数 传递 


MATLAB 中 通过 M 文件 编写 函数 时 ， 只 需要 指定 输入 和 输出 的 形式 参数 列表 ， 只 是 
在 函数 实际 被 调用 的 时 候 ， 才 把 具体 的 数值 提供 给 函数 声明 中 给 出 的 输入 参数 。 

MATLAB 中 参数 传递 过 程 是 传 值 传递 ， 也 就 是 说 ， 在 函数 调用 过 程 中 ，MATLAB 将 传 
入 的 实际 变量 值 赋 给 形式 参数 指定 的 变量 名 ,这些 变量 都 存储 在 函数 的 变量 空间 中 ,这 个 空 
间 和 工作 空间 变量 空间 是 独立 的 ， 每 一 个 函数 在 调用 中 都 有 自己 独立 的 函数 变量 空间 。 

例如 ， 编 写 函 数 

function Y=myfun(x,y,Z) 

在 命令 窗口 通过 o = myfun(3, 2, 0.5) 调 用 此 函数 , 那么 MATLAB 首先 会 建立 myfun 函 
数 的 变量 空间 ， 把 3 赋值 给 x， 把 2 赋值 给 》， 把 0.5 赋值 给 zx， 然后 执行 函数 实现 的 代码 ; 
在 执行 完毕 后 , 把 myfun 函数 返回 的 参数 y 的 值 传递 给 工作 空间 变量 w, 调用 过 程 结束 后 ， 
函数 变量 空间 被 清除 。 
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1 输入 和 输出 参数 的 数目 


MATLAEB 的 函数 可 以 具有 多 个 输入 或 输出 参数 。 通 常 在 调用 时 ,需要 给 出 和 函数 声明 
语句 中 一 一 对 应 的 输入 参数 ;而 输出 参数 个 数 可 以 按 参 数列 表 对 应 指定 ， 也 可 以 不 指定 。 
不 指定 输出 参数 调用 函数 时 ,MATLAB 默认 把 输出 参数 列表 中 第 一 个 参数 的 值 返 回 给 工作 
空间 变量 “ans"。 

MATLAB 中 可 以 通过 nargin 和 nargout 函数 确定 函数 调用 时 实际 传递 的 输入 和 输出 参 
数 个 数 ,结合 条 件 分 支 语句 ,就 可 以 处 理 函数 调用 中 指定 不 同 数目 的 输入 /输出 参数 的 情况 。 


【 例 4-4】 显示 函数 输入 和 输出 参数 的 数目 实例 。 


function [y1,yY2]=mytescnio (x1,x2) 
E nargin= 一 工 
Y1=x17 
if nargout 一 2 
Y2=x17 
end 
else 
if nargout 一 1 
Y1=x1+x27 
else 
Y1=x17 
Y2=x27 
end 
end 


这 个 函数 可 以 处 理 一 个 或 两 个 输入 参数 、 一 个 或 两 个 输出 参数 的 情况 。 当 只 有 一 个 输 
入 参数 xl 和 一 个 输出 参数 y1 时 ， 把 xl 赋值 给 y1; 当 有 1 个 输入 参数 xl 和 两 个 输出 参数 
yy2 时 ,把 xl 赋值 给 ?1 和 72; 当 有 两 个 输入 参数 x1、 xz 和 一 个 输出 参数 ?1 时 , 把 x1+x2 
的 计算 结果 赋值 给 ?1， 当 有 两 个 输入 参数 1、xz2 和 两 个 输出 参数 ?1、72 时 ， 把 xl 赋值 
给 y1， 并 把 达 赋值 给 )2。 函 数 调用 结果 如 下 所 示 : 


>> x=mytestnio(5) 





x = 5 

>> [x,y]=mytestnio(5) 
x = 5 

y= 5 

>> mytestnio(5) 
ans= 5 

>> x=mytestnio(5,7) 
x= 12 

>> [x,y]=mytestnio(5,7) 
x= 5 

y= 7 

>> mytestnio(5,7) 
ans= 5 


指定 了 输入 和 输出 参数 个 数 的 情况 比较 好 理解 ， 只 要 对 应 函数 M 文件 中 的 让 分 支 项 
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即 可 ;而 对 于 不 指定 输出 参数 个 数 的 调用 情况 ，MATLAB 是 按照 指定 了 所 有 输出 参数 的 
调用 格式 对 函数 进行 调用 的 ， 不 过 在 输出 时 只 是 把 第 一 个 输出 参数 对 应 的 变量 值 典 给 工作 
空间 变量 anso 

例如 “mytestnio(5,7)” 这 句 函数 调用 中 ， 实 际 上 是 按照 “[y1，)2J]=mytestmiotx1， 72)” 
这 种 形式 调用 的 ， 在 函数 变量 空间 中 xl 被 赋值 为 5，x2 被 赋值 为 7，y1 计算 结果 为 5， 吧 2 
计算 结果 为 7， 但 函数 只 把 输出 参数 列表 中 第 一 个 输出 变量 ( 即 y1 ) 的 取 值 返回 给 工作 空 
间 变 量 ans， 因 此 ，ans 取 值 为 5。 


2， 可 变数 目的 参数 传递 

函数 nargin 和 nargout 结合 条 件 分 支 语句 ， 可 以 处 理 可 能 具有 不 同 数目 的 输入 和 输出 
参数 的 函数 调用 ， 但 这 要 求 对 每 一 种 输入 参数 数目 和 输出 参数 数目 的 组 合 分 别 编写 代码 。 

有 些 情况 下 ， 用 户 可 能 并 不 能 确定 具体 调用 中 传递 的 输入 参数 或 输出 参数 的 个 数 ， 即 
具有 可 变数 目的 传递 参数 ，MATLAB 中 可 以 通过 varargin 和 varargout 函数 实现 可 变数 目 
的 参数 传递 ， 使 用 这 两 个 函数 ， 对 于 处 理 具有 复杂 的 输入 /输出 参数 个 数组 合 的 情况 也 是 很 
方便 的 。 

函数 varargin 和 varargout 把 实际 的 函数 调用 时 传递 的 参数 值 封装 成 一 个 元 胞 数组 ， 
此 ， 在 编写 函数 实现 部 分 的 代码 时 ， 就 要 用 访问 元 胞 数组 的 方法 访问 封装 在 varargin 或 
varargout 中 的 元 胞 或 元 胞 内 的 变量 。 


【 例 4-5】 ”可 变数 目的 参数 传递 实例 。 


function y=mytestvario(varargin) 

temp=0; 

for i=1:length(varargin) 
temp=temp+mean (varargin{fil(:))1 

enad 

y=temp/length(varargin) ; 


本 例 中 的 函数 mytestvario 以 varargin 为 输入 参数 ,从 而 可 以 接受 可 变数 目的 输入 参数 。 
函数 实现 部 分 首先 计算 了 各 个 输入 参数 ( 可 能 是 标量 、 一 维 数组 或 二 维 数组 ) 的 均值 ， 然 
后 计算 这 些 均值 的 均值 。 调 用 结果 如 下 所 示 : 

>> mytestvariol(4) 

ang = 4 

>> mytestvariol(4, [1 3]) 

ans = 3 

>> mytestvario(4, [1 3],[1 23;23 1],magic(4)) 

ans = 三 6.6250 

对 于 “mytestvario(4,[1 3],[1 23;23 1],magic(4))” 这 句 函 数 调用 ， 在 函数 变量 区 , varargin 
首先 被 赋值 为 一 个 元 胞 数组 “{4,[1 3],[1 23;23 1],magic(4)}”， 即 varargin 有 1 行 4 列 个 元 
胞 ， 各 个 元 胞 中 分 别 存储 了 一 个 标量 数值 、 一 维 行 数组 、2 行 2 列 的 二 维 数 组 和 4 行 4 列 
的 魔方 数组 ;在 函数 实现 部 分 ， 首 先 创建 中 间 变 量 temp， 并 初始 化 赋值 为 零 ( 用 来 存储 各 
个 元 胞 中 数据 均值 的 总 和 ) ， 然 后 计算 每 一 个 元 胞 中 所 有 数据 的 均值 并 将 结果 累加 到 temp 
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上 ;， 最 后 通过 “ytemp/length(varargin)” 计 算 这 些 均值 的 均值 。 

函数 varargin 和 varargout 也 可 以 放置 在 参数 列表 中 某 些 必然 出 现 的 参数 之 后 , 其 语法 
格式 有 如 下 几 种 形式 : 

(1 ) function [outl, out2] = examplel(a, b, varargin)， 表 示 函 数 examplel 可 以 接受 大 于 
或 等 于 两 个 输入 参数 ， 返 回 两 个 输出 参数 ， 两 个 必 选 的 输入 参数 是 gc 和 5， 其 他 更 多 的 输 
入 参数 被 封装 在 varargin 中 。 

(2 ) function 羽 几 varargout] = example2(x, y))， 表 示 函 数 example2 接受 两 个 输入 参数 
和 y， 返 回 大 于 或 等 于 两 个 输出 参数 ， 前 两 个 输出 参数 为 和)， 其 他 更 多 的 输出 参数 封装 
在 varargin 中 。 

函数 varargout 和 varargin 的 用 法 类 似 ， 只 需要 注意 访问 时 按照 访问 元 胞 数组 的 方法 ， 
这 里 就 不 再 举例 了 。 

3， 返回 被 修改 的 输入 参数 

MATLAB 函数 有 独立 于 MATLAB 工作 空间 的 自己 的 变量 空间 ， 因 此 ， 输 入 参数 在 函 
数 内 部 的 修改 都 只 具有 和 函数 变量 空间 相同 的 生命 期 ， 如果 不 指定 将 修改 后 的 输入 参数 值 
返回 到 工作 空间 ， 那 么 在 函数 调用 结束 后 这 些 修改 后 的 值 将 被 自动 清除 。 


【 例 4-6】 函数 内 部 的 输入 参数 修改 实例 。 


function y=mytest (x) 

X=X+5 7 

yY=x*21 

本 例 中 的 mytest 函数 内 部 ， 首 先 修改 了 输入 参数 x 的 值 ( x= x+5 )， 然 后 以 修改 后 的 x 
的 值 计算 输出 参数 》 的 值 ( 》 = xx2 )。 调 用 结果 如 下 所 示 

>> x=3 

x=- 3 

>> Y=mytest (X) 

y= 16 

>> x 

x=- 3 

由 此 结果 可 见 ， 调 用 结束 后 ， 函 数 变 量 区 中 的 x 在 函数 调用 中 被 修改 ， 但 此 修改 只 在 
函数 变量 区 有 效 ， 这 并 没有 影响 到 MATLAB 工作 空间 变量 空间 中 变量 x 的 值 。 函 数 调用 
前 后 ，MATLAB 工作 空间 中 的 变量 * 始终 取 值 为 3。 

那么 ， 如 果 用 户 希 望 在 函数 内 部 对 输入 参数 所 做 的 修改 也 对 MATLAB 工作 空间 的 变 
量 有 效 ， 就 需要 在 函数 输出 参数 列表 中 返回 此 输入 参数 。 

对 于 本 例 中 的 函数 ， 则 需要 把 函数 修改 为 “function [y, 如 =mytest(%)"， 而 在 调用 时 也 
要 使 用 “[D, 对 j= mytesto0)” 这 种 形式 。 


【 例 4-7】 函数 参数 传递 实例 。 将 修改 后 的 输入 参数 返回 给 MATLAB 工作 空间 。 


function [Y,x]j=mynewtest{(x) 
xX=x+57 
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MATLAB 工作 空间 中 的 调用 结果 如 下 所 示 : 


>> x=3 

蔗 

>> [y,x]=mynewtest (x) 
yY= 16 

x= 8 

> X 

x = 8 


通过 本 例 可 见 ， 函 数 调用 后 ，MATLAB 工作 空间 中 的 变量 x 取 值 从 3 变 为 8 ( 3+5 ) ， 
可 见 通过 [y, xj=mynewtest(x) 调 用 ， 实 现 了 函数 对 MATLAB 工作 空间 变量 的 修改 。 


4， 全 局 变量 

通过 返回 修改 后 的 输入 参数 ， 可 以 保留 函数 内 部 对 MATLAB 工作 空间 变量 的 修改 。 
而 另 一 种 殊途同归 的 方法 则 是 使 用 全 局 变量 。 声 明 全 局 变量 需要 用 到 global 关键 词 ， 语 法 
格式 为 “global variable"。 

通过 全 局 变量 可 以 实现 MATLAB 工作 空间 变量 和 多 个 函数 变量 的 共享 ， 这 样 ， 多 个 
使 用 全 局 变量 的 函数 和 MATLAB 工作 空间 共同 维护 这 一 全 局 变量 ， 任 何 一 处 对 全 局 变量 
的 修改 ， 都 会 直接 改变 此 全 局 变量 的 取 值 。 

在 应 用 全 局 变量 时 ， 通 常 要 在 各 个 函数 内 部 通过 global variable 语句 声明 ， 在 命令 窗 
口 或 脚本 M 文件 中 也 要 先 通过 global 声明 ， 然 后 进行 赋值 和 调用 。 


【 例 4-8】 全 局 变量 使 用 实例 。 


function y=myprocess (x) 
global T 

T=T*27 

yY=exp(T)*sin (x) ， 


在 命令 窗口 中 声明 全 局 变量 ， 然 后 赋值 调用 : 


>> global T 


>> T=0.3 

了 = 0.3000 

>> myprocess (pi/2) 
ans = “1.8221 

>> exp(T)*sin(pi/2) 
ans = 工 .8221 

>> 了 

T = 0.6000 


通过 本 例 可 见 ， 用 global 将 7 声明 为 全 局 变量 后 ， 函 数 内 部 对 7 的 修改 也 会 直接 
作用 到 MATLAB 工作 空间 中 。 函 数 myprocess 被 调用 一 次 后 ，7 的 值 从 0.3 变 为 0.6 
(0.3*2 ) 。 
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函数 句柄 实际 上 提供 了 一 种 间接 调用 函数 的 方法 。 创 建 函 数 句柄 需要 用 到 操作 符 @。 
前 面 已 经 讲 过 ， 匿 名 函数 实际 上 就 是 一 种 函数 句柄 ， 而 对 MATLAB 提供 的 各 种 M 文件 函 
数 和 内 部 函数 , 也 都 可 以 创建 函数 句柄 , 从 而 可 以 通过 函数 句柄 对 这 些 函数 实现 间接 调用 。 

函数 句柄 的 优点 如 下 : 

( 1 ) 方便 地 实现 函数 间 互 相 调 用 。 

( 2 ) 兼容 函数 加 载 的 所 有 方式 。 

( 3 ) 拓宽 子 函数 ， 包 括 局 部 函数 的 使 用 范围 。 

(4 ) 提高 函数 调用 的 可 靠 性 。 

( 5 ) 减少 程序 设计 中 的 宛 余 。 

( 6 ) 提高 重复 执行 的 效率 。 

创建 函数 句柄 的 一 般 语法 格式 如 下 所 示 : 


fhandle=efunction_fileame 


其 中 ， 

e。 function_filename 是 函数 所 对 应 的 M 文件 的 名 称 或 MATLAB 内 部 函数 的 名 称 ; 

。“@” 是 句柄 创建 操作 符 ; 

。fhandle 变量 保存 这 一 函数 句柄 。 

例如 fhandle=@sin 就 创建 了 MATLAB 内 部 函数 sin 的 句柄 ， 并 将 其 保存 在 fhandle 变 
量 中 ， 以 后 就 可 以 通过 fhandle(x) 来 实现 sin(x) 的 功能 。 

通过 函数 句柄 调用 函数 时 ， 也 需要 指定 函数 的 输入 参数 ， 比 如 可 以 通过 fhandle(argl， 
arg2，…, argm) 这 样 的 调用 格式 来 调用 具有 多 个 输入 参数 的 函数 。 对 于 那些 没有 输入 参数 的 
函数 ， 在 使 用 句柄 调用 时 ， 要 在 句柄 变量 后 加 上 空 的 圆 括号 ， 即 fhandle0)。 


【 例 4-9】 函数 句柄 的 创建 和 调用 实例 。 


>> fhd=esin 

fhd = esin 

>> x=0:0.25*pi:2*pi7 

>> fhd(x) 

ans=0 0.7071 1.0000 0.7071 0.0000 -0.7071 =-1.0000 -0.7071 
-0.0000 


MATLAB 中 提供 了 丰富 的 处 理 函数 句柄 的 函数 ， 如 表 4-1 所 示 。 








表 4-1 处 理 函 数 句柄 的 函数 
| 函数 说 明 
返回 一 个 结构 体 ， 存 储 了 函数 的 名 称 ， 函 数 类 型 ( 简单 函数 或 重 载 函数 )， 以 及 函 
数 M 文件 的 位 置 


functions(fhandle) 
onc2stfhandle) | 。 将 函 数 句 柄 转换 为 函数 名 称 字符 圳 ] 
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续 表 









































函数 说 明 
su2func(str) 将 字符 串 代表 的 函数 转换 为 函数 句柄 
save fename.mat fhandle 将 函数 句柄 保存 在 .mat 文件 中 
load filename-mat fhandle 把 .mat 文件 中 存储 的 函数 句柄 装载 到 工作 空间 
isa(var, function_handle) 检测 变量 var 是 不 是 函数 句柄 
isequal(fhda, fhdb) 检测 两 个 函数 句柄 是 否 对 应 于 同一 个 函数 
feval(fhandle) 调用 函数 句柄 mhandle 





【 例 4-10】 ”处 理 函 数 句柄 的 函数 使 用 实例 。 


>> fhda=eexp 
fhda = @exp 
>> fhdb=emyprocess 
fhdb = @myprocess 
>> functions (fhdb) 
ans = function: 'myprocess， 
type: 'simple' 
file: 'D: \MATLAB71\work\MATLABbook\EX-10\myprocess.m' 
>> isa(fhda, 'function_handle') 


ans = 
>> isequal(fhda,fthdqb) 
ans 一 0 


_MATLAB 程序 调试 
MATLAB 程序 调试 主要 是 指 发 现 和 纠正 程序 中 的 错误 。 


4.7.1 ”常见 程序 错误 
MATLAB 程序 常见 的 错误 有 以 下 几 类 。 


1， 矩阵 运算 方面 的 错误 

(1) 矩阵 下 标 索 引 使 用 错误 

MATLAB 的 计算 元 素 是 矩阵 ， 即 使 是 一 个 数 ，MATLAB 也 把 它 看 做 一 个 一 维 数组 。 
在 MATLAB 中 , 所 有 的 计算 都 是 以 矩阵 为 单元 进行 的 ， 和 矩阵 是 MATLAB 的 核心 。 需 要 非 
常 注意 的 是 :与 C 语言 等 编程 语言 的 习惯 不 一 样 ,MATLAB 的 语法 规定 矩阵 的 索引 从 1 开 
始 。 因 此 ， 在 访问 矩阵 ( 包括 向 量 、 二 维 矩阵 、 多 维 数组 ) 的 过 程 中 ， 下 标 索 引 如 果 从 0 
开始 ， 或 者 出 现 负数 ， 就 会 报错 。 

例如 ， 在 命令 窗口 输入 


A=[1,2;2,4]7 
R(0,1) 


输出 报错 为 : 
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?3?? ALLempted to access RAR(0,1); index must be a positive integer or logical. 

分 析 :， 如 果 改 为 4(1.0)， 则 输出 为 1， 表 示 访 问 4 的 第 1 行 第 1 列 的 元 素 。 同 类 的 常 
见 错误 还 有 : 在 引用 和 矩阵 元 素 的 时 候 ， 索 引 值 超出 矩阵 应 有 

(2 ) 答 阵 运算 对 象 维 数 不 匹 配 的 错误 

进行 矩阵 运算 时 ， 运 算 符 ( =，+，-，/，* 等 ) 两 边 的 运算 对 象 维 数 必须 匹配 。 

例如 ， 在 命令 窗口 输入 


ARA=[1，2; 3，3; 4，5]7 
B=[1，2，3; 4，5，6; 7，8，9]: 
ArB 


输出 报错 为 ， 


?3?? Error using ==> mtimes 











Tnner matrix aimensions must agree. 


分 析 : 4 是 3*2 的 矩阵 ， 妃 是 3*3 的 矩阵 ，4*B 是 矩阵 维 数 不 匹 配 ， 故 报错 。 如 果 对 
4 取 转 置 ， 然 后 再 相 乘 ， 则 不 会 报错 。 
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(3 ) 元 素 与 矩阵 运算 的 错误 

MATLAB 通过 “.” 来 区 分 矩阵 运算 和 元 素 运算 ， 当 元 素 与 矩阵 进行 运算 时 ， 容 易 忽 
略 “."。 
例如 ， 在 命令 窗口 输入 : 
R=[1，2，3]; 
B-6*A  % 对 和 的 每 个 元 素 都 乘 以 6 
C=6/A  % 用 6 除 以 A 的 每 个 元 素 


输出 报错 为 ， 


B = 6 12 18 
?3?? Error using ==> mrdivide 
Matrix dimensions must agree-. 


分 析 : 其 实 ， 写 为 “B-6.*ha” 进 行 运算 也 是 正确 的 ， 由 于 习惯 的 原因 ， 这 个 “.” 通 党 
省 略 ， 在 作 乘 法 时 不 会 报错 ， 但 在 作 除法 时 ， 就 错 了 。 改 为 以 下 语句 就 不 会 出 错 。 


C=6./A 
ce 百 3 
2. 函数 方面 的 错误 


(1 ) 函数 没有 定义 的 错误 
在 命令 窗口 中 可 以 运行 MATLAB 自 带 的 函数 以 及 用 户 自己 定义 的 函数 ， 如 果 不 是 这 
两 类 函数 ， 运 行 时 会 报错 。 
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例如 ， 在 命令 窗口 中 输入 : 

>> m_fun 

输出 报错 为 : 

??? Undefined function or variable ,m_fun,. 


分 析 : 可 能 的 出 错 原因 有 程序 文件 名 错 ; 文件 名 大 小 写 错 ; 该 文件 不 在 搜索 路 径 中 。 

解决 办 法 : 核对 文件 名 ; 检查 大 小 写 ， 统 一 命名 风格 ; 将 该 文件 复制 到 或 包含 在 工作 
路 径 下 。 

(2 ) 函数 给 出 变量 赋值 的 错误 

在 函数 中 ， 如 果 有 一 个 或 多 个 输出 变量 没有 被 赋值 ， 调 用 该 函数 时 ， 会 报错 。 

分 析 : 函数 如 果 带 有 输出 变量 ， 则 每 个 输出 变量 在 返回 的 时 候 都 必须 被 赋值 。 容 易 出 
现 这 个 错误 的 两 个 地 方 是 : 

。 在 部 分 条 件 判断 语句 ( 如 计 ) 中 没有 考虑 到 输出 变量 的 返回 值 。 

。 在 循环 和 迭代 过 程 中 部 分 变量 的 维 数 发 生 了 变化 。 

解决 办 法 :调试 程序 ， 仔 细 查 看 函数 返回 时 各 输出 变量 的 值 。 更 好 的 方法 是 ， 在 条 件 
判断 或 者 执行 循环 之 前 对 所 使 用 的 变量 赋 初 值 。 

(3 ) 在 命令 窗口 定义 函 教 的 错误 

在 MATLAB 中 ， 不 能 在 命令 窗口 或 者 脚本 文件 中 定义 函数 。 例 如 ， 在 命令 窗口 输入 ， 

>> function c = myfunta，b) 


输出 报错 为 : 


??? function c = myftun(a，b) 
Error: Function definitions are not permitted at the prompt or in scripts. 


分 析 : 在 命令 窗口 写 function ec = myfun (ab)， 此 错误 就 会 出 现 ， 因 为 函数 只 能 定义 在 
M 文件 中 。 关 于 脚本 文件 和 M 文件 的 区 别 请 查阅 MATLAB 基础 书籍 。 

简 言 之 : 

。 如 果 写 成 function 的 形式 , 那么 必须 写 在 M 文件 中 , 且 以 function 开头 ( 即 function 
语句 前 不 能 包含 其 他 语句 ， 所 有 语句 必须 放 在 function 中 ， 当 然 ，function 的 定义 
可 以 有 多 个 ， 各 function 之 间 是 并 列 关系 ， 不 能 伐 套 )。 

。 如 果 写 成 脚本 的 形式 ， 则 既 可 以 写 在 命令 窗口 中 , 也 可 以 写 在 M 文件 中 , 但 两 者 均 
不 能 包含 function 语句 ( 即 不 能 进行 函数 的 定义 ) 

解决 办 法 ， 新 建 一 个 M 文件 ， 然 后 再 进行 函数 的 定义 。 

总 之 , 对 于 一 些 格式 错误 , 如 函数 名 的 格式 错误 、 缺 括号 等 , 大 多 数 这 类 错误 MATLAB 

可 在 运行 时 检测 出 来 ， 并 显示 出 错 信息 和 位 置 ， 编 程 者 也 很 容易 纠正 。 而 算法 错误 、 逮 辑 
上 的 错误 ， 不 易 查 找 ， 遇 到 此 类 错误 时 需 耐 心 。 一 般 可 考虑 如 下 方法 ， 

。 删除 句 尾 分 号 “;"， 注 意 变量 值 的 变化 ; 将 每 步 执行 结果 输出 到 命令 窗口 ， 显 示 中 

间 结 果 。 
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e。 在 适当 位 置 加 上 keyboard 语句 ， 当 程序 执行 到 这 条 语句 时 ，MATLAB 会 暂停 执行 ， 
并 将 控制 权 交 给 用 户 ， 这 时 可 检查 和 修改 局 部 工作 空间 的 内 容 ， 从 中 找 出 错误 的 线 
索 ， 利 用 retum 命令 可 恢复 程序 执行 。 

。 在 函数 定义 行 之 前 加 上 “%” 注 释 掉 ， 使 之 变 成 脚本 语言 或 者 选用 “Text” 菜 单 
的 “Comment” 命 令 ， 注 释 掉 可 疑 的 代码 部 分 ; 这 样 ， 程 序 运行 出 错时 便 可 查看 M 
文件 中 产生 的 变量 。 

。 使 用 MATLAB 调试 器 设置 断 点 ， 或 单 步 执 行 ， 使 用 一 些 调试 和 分 析 工具 。 

下 面 讲述 程序 调试 的 一 些 工具 及 调试 方法 ， 熟 练 掌握 并 运用 这 些 工具 及 调试 方法 ， 能 

高 编程 的 效率 。 


4.7.2 ”调试 方法 

MATLAB 程序 有 直接 调试 法 和 工具 调试 法 这 两 种 调试 方法 。 
1. 直接 调试 法 

直接 调试 法 就 是 在 M 文件 中 ， 将 某 些 语句 后 面 的 分 号 去 掉 ， 人 迫使 M 文件 输出 一 些 中 
间 计 算 结果 ， 以 便 发 现 可 能 的 错误 。 常 用 的 做 法 有 : 

(1 ) 在 适当 位 置 ， 添 加 显示 某 些 关键 变量 值 的 语句 。 

( 2 ) 利用 echo 指令 ， 使 文件 运行 时 在 屏幕 上 逐 行 显示 文 件 内 容 ，echo on 能 显示 M 脚 
本 文件 ，echo FunName On 能 显示 名 为 FunName 的 M 函数 文件 。 

( 3 ) 在 原 M 脚本 或 函数 文件 的 适当 位 置 ， 添 加 指令 keyboard, 利用 该 语句 可 以 设置 程 
序 的 断 点 。 

( 4 ) 通过 将 原 M 函数 文件 的 函数 声明 行 注释 掉 ， 可 使 一 个 中 间 变 量 难于 观察 的 M 函 
数 文件 变 为 一 个 所 有 变量 都 保存 在 基本 工作 空间 中 的 M 脚本 文件 。 


2. 工具 调试 法 

工具 调试 法 就 是 在 程序 中 设置 一 些 断 点 ， 利 用 调试 菜单 ( Debug ) 中 的 一 些 选项 进行 
调试 。 

MATLAB 提供 了 进行 代码 调试 和 代码 分 析 优化 的 工具 ， 对 这 些 工具 一 般 的 MATLAB 
用 户 都 应 该 有 所 了 解 。 尤 其 是 断 点 调试 部 分 的 内 容 , 建议 读者 尽量 以 自己 的 程序 代码 为 例 ， 
多 加 练习 ， 熟 练 掌握 。 


4.7.3 调试 工具 


当 完成 MATLAB 代码 编写 后 , 用 户 就 可 以 在 命令 窗口 中 运行 代码 ( 脚本 或 函数 文件 )j。 
对 于 比较 简单 的 代码 ， 一 般 只 要 编程 习惯 较 好 ， 都 可 以 一 次 通过 。 但 对 于 很 多 比较 复杂 的 
情况 ， 或 者 用 户 初学 MATLAB 编程 ， 就 容易 在 运行 时 出 现 错误 。 这 时 候 ， 就 需要 利用 
MATLAB 的 调试 工具 对 出 现 错误 的 代码 进行 调试 纠 错 。 

MATLAB 的 代码 编辑 -调试 器 是 一 个 综合 了 代码 编写 调试 的 集成 开发 环境 *MATLAB 
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代码 调试 过 程 ， 主 要 是 通过 MATLAB 代码 编辑 -调试 器 的 Debug 菜单 下 的 子 项 进行 的 ， 如 
图 4-3 所 示 。 
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图 4.3 MATLAB 代码 编辑 -调试 器 的 Debug 菜单 


Debug 菜单 用 于 程序 调试 ， 需 要 与 Breakpoints 菜单 项 配合 使 用 。MATLAB R2008b 的 
Debug 菜单 中 的 菜单 项 介绍 如 下 。 

( 1 ) Open M-Files when Debugging: 用 于 调试 时 打开 M 文件 。 

(2 ) Step:， 在 调试 模式 下 ， 执 行 M 文件 的 当前 行 ， 对 应 的 快捷 键 是 Fl0。 

( 3 ) Step in: 在 调试 模式 下 ， 执 行 M 文件 的 当前 行 ， 如 果 M 文件 当前 行 调用 了 另 一 
个 函数 ， 那 么 进入 该 函数 内 部 ， 对 应 的 快捷 键 是 Fll。 

(4 ) Step Out;: 当 在 调试 模式 下 执行 “Step In" 进入 某 个 函数 内 部 之 后 , 执行 “Step Out” 
可 以 完成 函数 剩余 部 分 的 所 有 代码 ， 并 退出 函数 ， 暂 停 在 进入 函数 内 部 前 的 M 文件 所 在 
行 末尾 。 

(5 ) Save File and Run:， 运行 当前 M 文件 ， 快 捷 键 是 F5， 当 前 M 文件 设置 了 断 点 时 ， 
运行 到 断 点 处 暂停 。 

(6 ) Run configuration for: 运行 调试 配置 文件 。 打 开 需 调试 的 M 文件 后 ， 单 击 工 具 栏 
的 | 隔 = 按钮 ， 将 弹出 一 个 如 图 4-4 所 示 的 该 M 文件 的 运行 配置 文件 的 编辑 窗口 。 


CC Cam- 





图 4.4 运行 配置 文件 的 编辑 窗口 
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在 该 编辑 窗口 ， 用 户 可 以 添加 一 些 便于 调试 的 代码 、 变 量 赋值 、 输 入 参数 、 中 间 变 量 
结果 等 。 

在 图 4-4 所 示 的 例子 中 , 在 该 配置 文件 中 , 在 M 文件 运行 之 前 对 其 中 的 参数 进行 了 赋 
值 ， 运 行 之 后 对 其 中 的 参数 进行 了 运算 。 

有 了 该 配置 文件 后 ， 程 序 的 运行 结果 c= -18。 读 者 可 自己 体验 一 下 ， 加 强 掌握 。 

(7 ) Go Until Cursor: 运行 当前 M 文件 到 在 光标 所 在 行 的 行 尾 。 

需要 注意 ， 以 上 这 些 调 试 项 , 除了 “Run”( 运行 )， 都 需要 首先 在 M 文件 中 设置 断 点 ， 
然后 运行 到 断 点 位 置 后 ， 这 些 调试 项 才 可 启用 。 

( 8 ) SeUClear Breakpoint: 在 光标 所 在 行 开 头 设置 或 清除 断 点 。 

( 9 ) SeyModify Conditional Breakpoint...， 在 光标 所 在 行 的 开头 设置 或 修改 条 件 断 点 ， 
选择 此 子 项 ， 会 打开 “条 件 断 点 设置 ”对 话 框 ， 如 图 4-5 所 示 。 此 对 话 框 用 于 设置 在 满足 
什么 条 件 时 ， 此 处 断 点 有 效 。 

( 10 ) Enable/Disable Breakpoint: 将 当前 行 的 断 点 设置 为 有 效 或 无 效 。 

(11 ) Clear Breakpoints in All Files， 清除 所 有 M 文件 中 的 断 点 。 

( 12 ) Stop 计 Errors/Wamnings…: 设置 出 现 某 种 运行 错误 或 警告 时 ， 停 止 程序 运行 ， 选 
择 此 项 ， 会 打开 “错误 /警告 设置 ”对 话 框 ， 如 图 4-6 所 示 。 
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图 4-5 “条 件 断 点 设置 ”对 话 框 。 图 4-6 设置 当 出 现 某 种 运行 错误 或 警告 则 停止 程序 运行 


( 13 ) Exit Debug Mode， 退出 调试 模式 。 

上 面 逐 项 讲述 了 “Debug” 菜 单 下 每 一 个 子 项 的 意义 ， 实 际 上 ， 很 多 子 项 都 有 对 应 的 
快捷 工具 按钮 。 在 MATLAB 代码 编辑 -调试 器 中 ， 图 4-7 所 示 的 部 分 工具 按钮 就 是 用 于 M 
文件 调试 的 。 

图 4-7 中 的 各 个 工具 按钮 , 从 左 向 右 依次 对 应 于 SeUClear Breakpoint、Clear Breakpoints 
in All Files、Step、Step In、Step Out、Run、Exit Debug Mode 
等 菜单 子 项 。 个 测 | 草 允 事 :iD 搞 

通常 的 调试 步骤 是 : 图 4-7 ”调试 工具 按钮 

合 先 运行 ( Run ) 一 遍 M 文件 ， 针 对 具体 的 出 错 信息 ， 在 适当 的 地 方 设置 断 点 或 条 
件 断 点 。 
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合 再 次 运行 ( Run ) 到 断 点 位 置 ( 如 图 4.8 所 示 )， 此 时 MATLAB 把 运行 控制 权 交 
给 键盘 。 
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图 4-8 设置 断 点 后 运行 ( Run ) 到 断 点 所 在 位 置 


全 此 时 命令 窗口 出 现 “K>>” 提 示 符 ( 如 图 4-9 所 示 )， 在 命令 窗口 中 查询 M 文件 
运行 过 程 中 的 所 有 变量 ， 包 括 函数 运行 时 的 中 间 变 量 。 


但 运行 到 断 点 位 置 后 ， 用 户 可 以 选择 “Step/Step Into/step Out" 等 调试 运行 方式 ， 逐 
行 运行 并 适时 查询 变量 取 值 ， 从 而 逐渐 找到 错误 所 在 行 并 排除 错误 。 
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图 4-9 调试 模式 时 MATLAB 命令 窗口 把 控制 权 交 给 键盘 


4.7.4 _M 文件 分 析 工 具 


通过 "Debug” 菜单 对 M 文件 进行 调试 , 可 以 找 出 文件 中 的 编写 错误 和 运行 错误 并 纠正 。 
完成 了 调试 过 程 后 ， 用 户 编写 的 M 文件 就 可 以 正确 地 运行 了 。 但 可 能 运行 效率 还 不 是 最 优 ， 
这 就 需要 通过 MATLAB 提供 的 分 析 工 具 对 代码 进行 分 析 ， 然 后 有 针对 性 地 进行 优化 。 

MATLAB 7 的 新 功能 中 ， 有 一 项 是 可 以 检验 所 选 写 程序 的 执行 效率 。 这 个 功能 位 于 编 
辑 器 的 工具 的 一 个 选项 中 ， 称 为 M-LINT 检验 程序 代码 ( M-Lint )。 

这 个 选项 还 可 以 在 程序 完成 调试 后 ， 再 进一步 检查 程序 的 执行 效率 ， 生 成 一 个 建议 的 
报告 ( M-Lint Code Check Report )， 其 内 容 包括 相关 修正 事项 ， 以 及 如 何 使 程序 执行 时 更 
有 效率 ， 且 节省 处 理 时 间 等 。 对 于 大 程序 而 言 ， 这 项 功能 相当 有 用 。 
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MATLAB 提供 的 M 文件 分 析 工具 包括 M-Lint 工具 和 Profiler 工具 ， 它 们 都 有 图 形 操 

作 界 面 ， 使 用 简单 方便 ， 是 MATLAB 程序 分 析 优化 的 必用 工具 。 

M-Lint 分 析 工具 


MLLint 工具 可 以 分 析 用 户 M 文件 中 的 错误 或 性 能 问题 。 用户 可 以 先 在 代码 编辑 -调试 
器 中 打开 待 分 析 的 M 文件 ， 然 后 选择 “Tools” 菜 单 下 的 “M-Lint ”项 ， 如 图 4-10 所 示 。 
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图 4-10 通过 Tools 菜单 打开 M-Lint 工具 





图 4-10 所 示 的 是 实现 查找 10 ~ 1000 之 内 所 有 素数 的 M 文件 ， 它 的 脚本 如 下 。 


%Find the prime numbers between 10 anq 1000 
clear %clear the workspace 
result=[];) sresult save the prime numbers. 
$for-loop 
for i=10:1000 
Saefine a variable which is used to mark whether i is a prime number 
mark=17 
%check whether i is a prime number 
for j=2:i-1 
if mod(i,j)==0 





8add prime number to result 
E mark==1 
result=[result il7 
enda 
end 
Tesult 争 ouctPuL 


运行 M-Lint 工具 后 结果 如 图 4-11 所 示 。 
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图 4-11 M-Lint 分 析 结果 


从 图 4-11 可 以 看 出 ，M-Lint 分 析 完 成 后 ， 返 回 一 个 浏览 器 界面 的 分 析 报告 ( Check 
Report )， 报 告 中 包括 被 分 析 的 M 文件 的 路 径 ， 以 及 若干 个 分 析 结果 ( 图 4-11 所 示 中 的 “2 
messages” 表 示 只 有 2 条 分 析 结果 )。 

M-Lint 分 析 结果 中 经 常 出 现 的 错误 或 问题 报告 包括 : 没有 以 分 号 结束 以 阻止 中 间 变 量 
输出 ， 变 量 在 文件 中 从 没有 被 其 他 语句 调用 ， 以 及 循环 过 程 中 数组 尺寸 会 增加 等 。 

实际 上 ，M-Lint 分 析 得 到 的 问题 ， 并 不 一 定 必须 消除 ， 而 是 要 具体 问题 具体 分 析 。 当 
用 户 认 可 某 一 条 分 析 结果 时 ， 单 击 分 析 结果 中 的 行 号 ， 就 可 以 打开 相应 的 M 文件 并 定位 
到 该 行 ， 方 便 地 修改 代码 了 。 

M-Lint 不 仅 可 以 分 析 单个 M 文件 ， 还 可 以 分 析 一 个 文件 夹 下 的 所 有 M 文件 。 通 常 在 
MATLAB 主 界面 下 ， 选 择 “Desktop” 菜 单 下 的 “Current Directory”， 则 可 以 显示 文件 夹 面 
板 ， 通 过 单 击 此 面板 项 部 的 M-Lint 工具 则 可 以 分 析 相应 文件 夹 下 的 所 有 M 文件 。 


4.7.5 Profiler 分 析 工 具 


Profiler 工具 是 MATLAB 提供 的 另 一 个 功能 强大 的 代码 分 析 工具 ， 利 用 它 可 以 获取 每 
行 代码 的 运行 情况 ， 包 括 运行 时 间 和 调用 次 数 等 ， 因 而 知道 哪些 语句 行 花费 的 时 间 最 多 ， 
可 以 集中 精力 进行 改进 和 优化 。 

使 用 Profiler 时 ， 用 户 可 以 提前 在 代码 编辑 调试 器 中 打开 M 文件 ， 然 后 选择 “Tools” 
菜单 下 的 “Open Profiler” 项 ， 就 打开 了 Profiler 的 图 形 界面 ， 运 行 Profiler 分 析 工 具 。 

单 击 图 形 界面 中 所 示 的 “Start Profiling ”按钮 ， 就 可 以 分 析 此 M 文件 ， 分 析 结果 如 图 
4-12 所 示 。 








图 4-12 Profiler 分 析 结果 
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从 图 4_12 可 见 ，Profiler 分 析 结果 给 出 了 调用 函数 名 称 、 调 用 次 数 、 消 耗 总 时 间 等 信 
息 。 单 击 图 4-12 中 蓝 色 的 “Untitled1"， 可 以 打开 关于 此 M 文件 更 加 详细 的 分 析 报告 ， 如 
图 4-13 所 示 。 











图 4-13 ”更 详细 的 Profiler 分 析 结 果 


分 析 报告 可 以 根据 用 户 的 需要 显示 所 需 的 内 容 ， 图 4-13 中 有 6 项 显示 内 容 可 供 选择 。 
4-13 所 示 的 更 详细 的 Profiler 分 析 结果 提供 了 Untitledl.m 文件 运行 中 最 消耗 时 间 的 部 分 
及 其 具体 耗 时 信息 。 用 户 可 以 有 针对 性 地 修改 那些 最 消耗 时 间 的 代码 。 

一 般 来 说 ， 应 该 尽量 避免 不 必要 的 变量 输出 ， 循环 赋值 前 要 预定 义 数组 尺寸 ， 多 采用 
向 量化 的 MATLAB 函数 ， 少 采用 数组 ， 这 些 都 能 够 提高 MATLAB 程序 的 运行 性 能 。 


加 到 MATLAB 程序 设计 技巧 


MATLAB 是 一 种 科学 计算 语言 ， 但 同时 也 具有 和 C、Fortran 等 高 级 语言 相 类 似 的 语 
言 特征 ， 能 方便 地 实现 程序 控制 。 利 用 MATLAB 的 程序 控制 功能 ， 可 以 将 有 关 MATLAB 
命令 编 成 程序 存储 在 一 个 文件 中 ( M 文件 )， 然后 运行 该 文件 ，MATLAB 就 会 自动 依次 执 
行文 件 中 的 命令 ， 直 到 全 部 命令 执行 完毕 。 

编程 时 ， 首先 要 考虑 到 变量 初 值 或 者 变量 类 型 改变 时 ， 程序 的 应 对 能 力 ， 即 程序 的 鲁 
棒 性 ， 因 此 出 色 的 程序 要 具有 较 好 的 例外 处 理 机 制 。 此 外 ， 还 要 考虑 程序 的 执行 效率 。 

一 些 编程 技巧 能 提高 程序 的 执行 效率 ， 因 此 ， 掌握 一 些 MATLAB 的 编程 技巧 也 是 非 
常 必 要 的 ， 下 面 对 常 用 的 MATLAB 编程 技巧 进行 介绍 。 


4.8.1， 记 套 计算 


一 个 程序 的 执行 速度 取决 于 它 所 调用 的 子 程序 个 数 以 及 采用 的 算法 。 通常 希望 子 程序 
越 少 越 好 ， 算 法 效率 越 高 越 好 。 

崔 套 计算 是 一 种 具有 较 小 时 间 复杂 度 的 算法 ， 如 【 例 4.11 】 所 示 。 

【 例 4-11】 钨 套 计算 与 直接 求 值 的 比较 实例 。 考虑 下 面 两 个 多 项 式 ， 其 中 式 ( 坟 ) 
为 式 (* ) 的 馈 套 表达 式 : 
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POCO = +aax2+ax+ao (*#) 
PICD)= (aax+az)x+aD)x+ao (5 


解 : 易 知 式 ( * ) 和 式 { ** ) 所 需要 的 乘法 数 分 别 为 6 次 和 3 次 。 显 然后 者 具有 更 高 的 执 
行 效率 。 
下 面 用 具体 程序 进行 说 明 ， 创 建 函 数 ex0411。 


function ex0411() 
N = 100000; 
aa= [1:N]7 
X 1 





tic % 初 始 化 时 钟 
pl1 = sum(a.*x.^[N-1:-1:0])7 按照 (*) 求 值 
pl1， koc % 时 钟 停止 ， 获 得 执行 时 间 
tic， p2=a(1)7 
for i = 2:N % 驹 套 计 算 (**) 
p2 = p2*x+ati); 
end 
p2， toc 
tic， Pp3 = polyval(a，x)， toc % 用 MATLAB 自 带 函 数 求 值 


运行 函数 ， 输 出 结果 如 下 所 示 ; 


pl1 = 5.0001e+r009 
Elapsed time is 0.035852 seconds 
p2 = 5.0001e+009 
PElapsed time is 0.005543 seconds . 
p3 = 5.0001e+009 
Elapsed time is 0.088367 seconds . 


可 见 ， 艇 套 算法 耗 时 最 少 ， 而 用 polyval 求 值 执行 速度 最 慢 。 
采用 饮 套 算法 不 仅 能 够 提高 执行 效率 ， 而 且 此 方法 具有 更 强 的 解决 问题 的 能 力 ， 下 面 
的 实例 可 以 说 明 这 个 问题 。 


【 例 4-12】 钳 套 计算 与 非 外 套 计算 的 比较 实例 。 求 possion 分 布 的 有 限 项 和 ， 形 如 ， 
1 Me 本 
SU0)= 包 页 


解 ， 由 概率 论 知 识 可 知 ， 当 M 很 大 时 ， 上 式 的 值 趋 近 于 1。 
分 别 用 式 (* ) 和 式 ( +* ) 来 求解 ， 创 建 函 数 ex0412。 


function ex04121() 
r = 80) 
M = 160; 
P = exp(-r); 
S1 = 0; 
for k = 1:M 
P=p*r/K % 骇 套 , 式 (**) 
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S1=S1+p; 

enad 

S1 

S2= 0; 

for kx = 1:M 
P = r^k/factorial(k); % 非 氏 套 , 式 (*) 
s2 = S2 + p; 

ena 

S2*exp (-z) 7 

S2 


运行 函数 ， 输 出 结果 如 下 所 示 ， 


1.0000 
5.5406e+034 


由 结果 可 知 ， 嵌 套 方法 的 结果 非常 接近 真实 值 ， 而 非 嵌 套 的 方法 根本 无 法 得 到 正确 的 
结果 。 





中 
ET 


4.8.2 ”循环 计算 


循环 计算 可 按照 给 定 的 条 件 , 重复 执行 指定 的 语句 。MATLAB 用 于 实现 循环 计算 的 语 
句 有 for 语句 和 while 语句 。 

对 于 循环 的 使 用 需要 注意 以 下 几 点 。 

(1 ) 尽量 避免 使 用 循环 。 在 MATLAB 编程 中 ， 采用 循环 会 降低 程序 的 执行 速度 ， 应 
尽量 避免 使 用 ， 可 以 用 其 他 方式 ， 如 向 量 运算 等 代替 。 

(2 ) 为 了 得 到 最 大 的 速度 ， 在 for 循环 被 执行 之 前 ， 应 预先 分 配 数组 。 否 则 ， 在 for 循 
环 内 每 执行 一 次 命令 ， 就 会 对 数组 重新 分 配 一 次 内 存 ， 这 样 会 降低 MATLAB 的 执行 效率 。 

( 3 ) 优先 考虑 内 联 ( inline ) 函数 ， 和 矩阵 运算 应 该 尽量 采用 MATLAB 的 内 联 函 数 ， 因 为 
内 联 函 数 是 由 更 底层 的 编程 语言 C 语言 构造 的 ， 其 执行 速度 显然 快 于 使 用 循环 的 矩阵 运算 。 

(4) 应 用 MEX 技术 。 尽 管 采用 了 很 多 措施 ， 但 执行 速度 仍然 很 慢 ， 比 如 耗 时 的 循环 
是 不 可 避免 的 ， 这 样 就 应 该 考虑 用 其 他 语言 ， 如 C 或 Fortran 语言 。 按 照 MEX 技术 要 求 的 
格式 编写 相应 部 分 的 程序 ， 然 后 通过 编译 连接 ， 形 成 在 MATLAB 中 可 以 直接 调用 的 动态 
连接 库 ( DLL ) 文件 ， 这 样 可 以 显著 地 加 快运 算 速度 。 有 关 MEX 技术 及 其 应 用 的 详细 内 
容 可 参考 相关 书籍。 


4.8.3 ”使 用 例外 处 理 机 制 


优秀 的 程序 员 能 够 指导 用 户 如 何 使 用 他 编写 的 程序 ， 而 且 在 用 户 使 用 不 当时 ， 能 够 给 
出 错误 提示 信息 ， 并 引导 用 户 正确 使 用 函数 。 前 面 编写 的 一 些 程序 都 没有 相应 的 错误 处 理 
机 制 ， 如 函数 ex0413， 其 输入 应 大 于 零 ， 当 输 入 小 于 零 时 会 得 到 错误 的 结果 。【 例 4-13] 
给 出 了 这 样 的 实例 。 


【 例 4-13】 ”例外 处 理 机 制 使 用 实例 。 用 户 输入 错误 的 函数 参数 时 的 例外 处 理 ， 给 函 
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数 ex0413 输入 错误 的 参数 ， 如 下 所 示 : 


>> ex0413 (-1) 

Elapsed time is 0.000017 seconds . 

mm= 1 

显然 错误 的 结果 是 由 于 用 户 不 清楚 函数 参数 的 取 值 范围 导致 的 。 这 种 错误 由 于 并 不 影 
响 程序 的 运行 ， 因 而 很 难 被 发 现 。 所 以 程序 员 在 编程 时 ， 应 当 考虑 到 可 能 发 生 的 此 类 错误 ， 
并 给 出 处 理 错误 的 机 制 和 错误 提示 信息 。 

对 上 例 ， 如 果 用 户 输入 了 错误 的 参数 ， 可 以 采用 下 面 语句 终止 程序 ， 并 提示 出 错 ， 


if n<0 
error('input must be positive，stopped'); 
end 


此 时 ， 再 执行 上 面 的 命令 ， 结 果 如 下 所 示 ， 

>> ex0413 (-1) 

?3?? Error using 一 > ex0413 

input must be positive，stopped 

这 种 错误 多 数 都 是 由 于 越界 造成 的 ， 尤 其 在 使 用 矩阵 时 ， 要 注意 引用 矩阵 位 置 不 要 超 
过 它 的 边界 。 另 外 ， 如 果 用 户 输入 的 函数 参数 超过 设 定 的 最 大 个 数 ， 或 者 类 型 不 合 要 求 也 
会 出 现 这 种 错误 。 

但 一 般 而 言 , 对 于 输入 参数 小 于 设 定 个 数 的 情形 , MATLAB 内 置 程序 一 般 会 对 未 赋值 
参数 作 默 认 处 理 。 典 型 的 例子 是 plot(K, 如 函数 ，plot( 默 认 的 无 坐标 是 [0, 1, 2..] 序 列 。 

程序 员 在 编写 程序 的 时 候 也 应 当 注意 处 理 这 种 情况 。 采 用 nargin 函数 可 以 判断 输入 参 
量 的 个 数 ， 从 而 设 定 未 被 指定 的 输入 参数 的 值 或 者 直接 报错 。 


【 例 4-14】 nargin 函数 应 用 实例 。 利 用 nargin 函数 ， 实 现 两 个 多 项 式 的 相 加 ， 并 具 
有 一 定 的 报错 功能 。 


解 : 编写 函数 ex0414。 








function p=ex0414(a，b) % 求 多 项 式 a，b 的 和 p 

if nargin 一 1 % 输 入 参数 个 数 为 1 ， 另 一 个 默认 参数 为 全 0 向 量 
b=zeros(4，1) 

elseif nargin 一 0 
error('empty input'); 。 % 输 入 参数 个 数 为 0， 报错 

end 

a=a(:).，;b=b(:).， 


Pa=length(a) ; nb=length(b) :; 
p=[zeros(1，nb-na) al+[zeros(1，na-nb) b] ; % 多 项 式 相 加 


在 MATLAB 命令 窗口 中 输入 正确 的 参数 ， 调 用 该 函数 ， 输 出 正确 的 结果 ， 如 下 所 示 : 


>> a=[1 2 3 4]) 
>> ex0414(a) 
ans = 1 ， 汪 4 
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在 MATLAB 命令 窗口 中 输入 错误 的 参数 ， 调 用 该 函数 ， 输 出 报错 结果 ， 如 下 所 示 : 


>> ex0414() 
?3?? Error using 一 > ex0414 
empty input 


可 见 ， 用户 输入 参数 不 合 要 求 时 , 会 作 默认 处 理 或 报错 ， 使 得 程序 具有 更 强 的 适应 性 。 


4.8.4 ”使 用 全 局 变量 


全 局 变量 是 指 在 不 同 的 工作 空间 以 及 基本 的 工作 空间 中 可 以 共享 的 变量 。 用 户 只 需要 
在 主 程序 或 者 任何 子 程序 中 声明 一 个 或 多 个 全 局 变量 ， 则 在 函数 和 主 程序 中 都 可 以 直接 引 
用 它们 ， 采 用 如 下 格式 生成 全 局 变量 : 


global v1 v2-.vn 


表达 式 中 各 变 重 之 间 用 空格 隔 开 。 

使 用 全 局 变量 时 要 注意 以 下 几 点 : 

(1 ) 利用 全 局 变量 在 主 程序 和 函数 之 间 不 需要 经 过 输入 或 输出 变量 就 可 以 直接 传递 数 
据 。 但 要 注意 在 函数 调用 中 使 用 它们 时 ， 调 用 结束 后 全 局 变量 在 工作 空间 中 仍然 存在 。 

(2 ) 两 个 或 多 个 函数 也 可 以 共有 一 个 全 局 变量 ， 只 要 同时 在 这 些 函数 中 用 Blobal 语句 
定义 即 可 。 

( 3 ) 使 用 全 局 变量 时 必须 十 分 小 心 ， 最 好 把 全 局 变量 名 取得 长 一 些 或 全 部 用 大 写 ， 以 
免 与 函数 中 的 局 部 变量 重 名 。 如 果 重 名 ， 容 易 出 现 致命 错误 。 所 以 ， 使 用 全 局 变量 不 是 一 
个 好 的 编程 方法 。 

(4 ) 一 旦 变量 被 声明 为 全 局 的 ， 则 在 任何 声明 它 的 地 方 都 可 以 对 它 进行 修改 。 这 在 一 
定 程度 上 破坏 了 子 程序 的 独立 性 。 如 果 全 局 变量 被 多 个 子 程序 修改 ， 则 用 户 很 难 知道 全 局 
变量 的 确切 值 ， 这 使 得 程序 的 可 读 性 大 大 下 降 。 

下 面 用 实例 进行 说 明 全 局 变量 的 用 法 。 


【 例 4-15】 ”全 局 变量 使 用 实例 。 本 例 用 以 说 明 全 局 变量 的 声明 及 函数 传递 。 


建立 子 程序 ex0415.m 和 主 程序 ex0415main.m， 同 时 在 子 程序 ex0415.m 以 及 主 程序 
ex0415main.m 中 定义 全 局 变量 D， 具 体 程序 如 下 所 示 : 


function x = ex0415(t，D) 

global D % 声 明 全 局 变量 
tl(finatt 一 0)) = eps' s 防 止 分 母 出 现 0 项 
x = sin(pi*t/D) ./(pi*c/D); 

function ex0415main()% 主 函数 

global D 

D=2; 












上 = bl +[0:1001/100* (tb2 - bl); 
% 通 过 全 局 变量 传递 参数 
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plot (Et， ex0415(c) ) 


本 程序 运行 结果 如 图 4-14 所 示 。 
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图 4-14 【 例 4-15 】 输 出 结果 


如 果 在 子 程序 ex0415.m 中 修改 全 局 变量 的 值 ， 则 变量 声明 时 即 对 其 进行 赋值 。 例 如 
将 ex0415.m 中 的 声明 语句 改 为 ,global D=1， 则 运行 后 可 得 图 4-15 所 示 结 果 。 
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图 4-15 【 例 4-15 】 中 全 局 变量 在 子 程序 中 被 修改 的 输出 结果 


显然 ，ex0415.m 中 对 全 局 变量 的 赋值 覆盖 了 ex0415main.m 中 的 赋值 ， 但 这 种 修改 在 
主 程序 中 却 不 能 得 到 反映 。 如 果 主 程序 和 子 程序 不 是 同一 个 程序 员 编 写 的 ， 几 乎 很 难 找到 
结果 与 程序 不 符合 的 原因 。 不 过 ， 在 使 用 全 局 变量 时 ，MATLAB 会 给 出 如 下 的 警告 信息 ， 
提示 用 户 注意 全 局 变量 是 否 在 其 他 地 方 被 修改 : 
Warning: The value of local variables may have been changed to match the 


globals. Future versions of MATLAB will require that you declare a variable to 
be global before you use that variable. 
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4.8.5 通过 varargin 传递 参数 


在 编写 函数 时 varargin 只 能 作为 函数 的 最 后 一 个 参数 ， 主 要 传递 函数 中 调用 的 子 函数 
中 可 选项 的 参数 ， 其 大 小 也 随 着 输入 参数 的 变化 而 发 生 改变 。 


【 例 4-16】〗 通过 varargin 传递 参数 的 实例 。 该 实例 实现 在 不 同 输入 参数 时 对 函数 
ex0415 的 作 图 ， 其 中 通过 varargin 传递 可 选 参数 。 


解 ， 分 别 编写 主 程序 ex0416.m 和 作 图 程序 ex0416plocmo 


function ex0416() % 主 程序 。 通 过 varargin 传递 可 选 参数 

D=1; bl=-2;b2=2; 

t = bl+[0:100]/100*(b2 - bl); 

bounds = [bl b2]; 

subplot (1,3,1)， ex0416plot ('ex0415')  % 作 出 x 的 函数 图 ，bouds 为 默认 值 [-1,11 
axis([bl b2 -0.4 1.2]) 

subplot (1,3,2)， ex0416plot ('ex0415',bounds)% 输 入 两 参数 ， 作 [-2,2] 上 x 函数 图 
axis{([bl b2 -0.4 1.2]) 

subplot (1,3,3) ，ex0416plot ('ex0415',bounds,D) % 可 选项 输入 为 1 

axis([bl b2 -0.4 1.2]) 

function ex0416plot(ftn,bounds,varargin) % 子 程序 。varagin 为 可 选 变量 ， 输 入 时 


s% 可 以 不 考虑 
if nargin < 2 
bounds = [-1 1]; %bounds 默认 为 [-1,11 
end 
bl = bounds (1); b2 = bounds(2); 
t= bl + [0:100]/100*(b2 - bl); 
x = feval(ftn，t，vararginf:])7 
P1LoL (tx) 
运行 主 程序 ， 输 出 结果 如 图 4-16 所 示 。 
12) 12， 1.2 
让 1 1 
08 08 08 
| 
os| 06 08 
04 04 04 
| 
0.2， 02 02 
0 0 0 
2 -02 .02 
| 了 
6 2 0 2 0 o 2 


图 4-16 ”varargin 函数 传递 参数 
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对 于 一 个 具有 多 输入 参数 的 程序 , 传统 的 方法 是 针对 所 有 可 能 出 现 的 输入 情况 进行 处 
理 。 上 例 对 应 了 3 种 输入 参数 情况 ， 即 输入 参数 个 数 分 别 为 1、2、3 的 情况 。 普 通 处 理 方 
法 是 利用 证 elseif-else 结构 对 其 进行 处 理 。 当 变量 很 多 时 ， 该 方法 过 于 烦琐 。 

由 于 varargin 本 身 可 以 根据 输入 参数 个 数 的 变化 自动 调节 大 小 ， 因 此 ， 在 调用 具有 多 
个 可 选 参数 的 子 程序 的 过 程 中 使 用 varargin 时 ， 可 以 大 大 简化 程序 。 


本 章 围绕 数值 计算 介绍 了 MATLAB 程序 设计 的 基础 知识 , 包括 MATLAB 的 基本 操作 
和 编程 技巧 ， 这 些 都 是 后 面 内 容 的 基础 。 

MATLAB 拥有 众多 的 内 置 函 数 ， 学 习 MATLAB 时 ， 读 者 不 要 试图 完全 记 住 或 者 掌握 
它们 ， 需 要 学 会 使 用 heljp、lookfor 等 命令 查找 所 需 的 命令 或 函数 。 

在 编写 MATLAB 程序 , 尤其 是 大 型 、 复 杂 的 MATLAB 程序 时 , 要 多 从 用 户 角 度 考 虑 ， 
力求 让 程序 的 例外 处 理 机 制 更 完善 , 具有 更 好 的 可 读 性 , 但 同时 也 要 考虑 算法 的 执行 效率 ， 
找到 这 两 方面 的 一 个 较 好 的 平衡 。 
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Simulink 的 出 现 给 控制 系统 分 析 与 设计 带 来 了 福音 。 它 有 两 个 主要 功能 : Simu ( 仿真 ) 
和 Link ( 连接 )， 即 该 软件 可 以 利用 鼠标 在 模型 窗口 上 绘制 出 所 需要 的 控制 系统 模型 ， 然 
后 利用 Simulink 提供 的 功能 来 对 系统 进行 仿真 和 分 析 。 

在 实际 工程 中 ， 控 制 系统 的 结构 往往 很 复杂 ， 如 果 不 借 助 专用 的 系统 建 模 软件 ， 则 很 
难 准 确 地 把 一 个 控制 系统 的 复杂 模型 输入 计算 机 ， 对 其 进行 进一步 的 分 析 与 仿真 ， 可 见 ， 
掌握 Simulink 对 于 一 个 从 事 自动 控制 方面 工作 的 人 来 说 是 非常 必要 的 。 


_Simulink 仿真 概述 


Simulink 是 MATLAB 软件 的 扩展 ， 它 是 实现 动态 系统 建 模 和 仿真 的 一 个 软件 包 。 它 
与 MATLAB 语言 的 主要 区 别 在 于 ， 它 与 用 户 交互 接口 是 基于 Windows 的 模型 化 图 形 输入 
的 ， 从 而 使 得 用 户 可 以 把 更 多 的 精力 投入 到 系统 模型 的 构建 而 非 语言 的 编程 上 。 

所 谓 模 型 化 图 形 输入 是 指 Simulink 提供 了 一 些 按 功能 分 类 的 基本 系统 模块 , 用 户 只 需 
要 知道 这 些 模块 的 输入 、 输 出 及 模块 的 功能 ， 而 不 必 考察 模块 内 部 是 如 何 实现 的 ， 通 过 对 
这 些 基 本 模块 的 调用 ， 再 将 它们 连接 起 来 就 可 以 构成 所 需要 的 系统 模型 { 以 .mdl 文件 进行 
存 取 )， 进 而 进行 仿真 与 分 析 。 

Simulink 的 最 新 版 本 是 Simulink 7.4( 包含 在 MATLAB R2009b 里 ) MATLAB R2007b 
里 的 版 本 为 7.0 版 ， 它 们 的 基本 功能 相差 不 大 。 


5.1.1 _ Simulink 的 启动 与 退出 


Simulink 的 启动 有 两 种 方式 。 一 种 是 启动 MATLAB 后 , 单 击 MATLAB 主 窗口 的 快捷 
按钮 困 来 打开 “Simulink Library Browser” 窗 口 ， 如 图 5-1 所 示 。 另 一 种 是 在 MATLAB 
命令 窗口 中 输入 “Simulink" ， 在 桌面 上 会 出 现 一 个 叫做 “Simulink Library Browser” 的 窗 
口 ， 在 这 个 窗口 中 列 出 了 按 功能 分 类 的 各 种 模块 的 名 称 。 

在 MATLAB 命令 窗口 中 输入 “simulink3 ”， 在 桌面 上 会 出 现 一 个 用 图 标 形式 显示 的 
“Library :simulink3” 的 Simulink 模块 库 窗 口 ， 如 图 5-2 所 示 。 这 两 种 模块 库 窗口 界面 只 是 
显示 形式 不 同 ,用 户 可 以 根据 个 人 喜好 选用 , 一 般 第 二 种 窗口 更 直观 、 形象 , 适合 初学 者 ， 
但 使 用 时 会 打开 太 多 的 子 窗口 。 

Simulink 启动 后 ， 便 可 打开 如 图 5-3 所 示 的 Simulink 的 仿真 编辑 窗口 ， 用 户 此 时 就 可 
以 开始 编辑 自己 的 仿真 程序 了 。 
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En 





图 5-1 Simulink 模块 库 浏览 界面 








Simulink 的 退出 操作 比较 简单 ， 只 要 关闭 所 有 模型 窗口 和 Simulink 模块 库 窗口 即 可 。 


5.1.2 Simulink 模块 库 


在 进行 系统 动态 仿真 之 前 , 应 绘制 仿真 系统 框图 , 并 确定 仿真 所 需 用 的 参数 。Simulink 
模块 库 包含 大 部 分 常用 的 建立 系统 框图 的 模块 ， 如 图 5-4 所 示 。 下 面 简要 介绍 常用 模块 。 





交 


图 5-4 Simulink 模块 浏览 窗口 
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1. Simulink 模块 库 分 类 
Simulink 模块 库 按 功能 分 为 以 下 16 类 子 模块 库 。 
(1 ) Commonly Used Blocks 模块 库 : 为 仿真 提供 常用 元 件 。 
{ 2 ) Continuous 模块 库 ， 为 仿真 提供 连续 系统 元 件 。 
( 3 ) Discontinuities 模块 库 : 为 仿真 提供 非 连续 系统 元 件 。 
( 4 ) Discrete 模块 库 : 为 仿真 提供 离散 元 件 。 
( 5 ) Logic and Bit Operations 模块 库 : 提供 逻辑 运算 和 位 运算 的 元 件 。 
( 6 ) Lookup Tables 模块 库 : 线形 插值 查 表 模块 库 。 
(7 ) Math Operations 模块 库 : 提供 数学 运算 功能 元 件 。 
( 8 ) Model Verification 模块 库 : 模型 验证 库 。 
(9 ) Model-Wide Utilities 模块 库 ， 进 行 模型 扩充 。 
( 10 ) Ports & Subsystems 模块 库 : 端口 和 子 系统 。 
(11 ) Signals Attributes 模块 库 : 信号 属性 模块 
( 12 ) Signals Routing 模块 库 : 提供 用 于 输入 、 输出 和 控制 的 相关 信号 及 相关 处 理 。 
{ 13 ) Sinks 模块 库 : 为 仿真 提供 输出 设备 元 件 。 
( 14 ) Sources 模块 库 : 为 仿真 提供 各 种 信号 源 。 
( 15 ) User-defined Functions 模块 库 : 用 户 自 定义 函数 元 件 。 
(16 ) Additional Math & Discrete 模块 库 : 附加 的 数学 和 离散 模块 库 。 





2 过程 控制 系统 仿真 中 常用 的 模块 

Simulink 的 模块 库 能 进行 很 多 领域 的 仿真 ， 如 控制 系统 、 通 信 系 统 等 。 下 面 对 过 程控 
制 系统 仿真 中 经 常用 到 的 模块 进行 简要 介绍 ， 其 他 模块 的 使 用 方法 其 实 都 类 似 ， 具体 的 细 
节 请 参考 Simulink 自 带 的 帮助 文档 。 

(1) 信号 源 部 分 模块 

过 程控 制 系统 仿真 中 ， 在 信号 源 部 分 常用 的 是 输入 源 模块 ( Sources )， 其 中 常用 的 子 
模块 如 表 5-1 所 示 。 


表 5-1 常用 的 输入 源 模块 
横 块 名 








Band-Limited White Noise 带 限 白 咱 声 





| Clock 显示 和 提供 仿真 时 间 





Constant 产生 一 个 常 值 





From FileCmab 从 文件 读 取 数 据 





From Workspace 从 工作 空间 中 读 取 数 据 





mi 输入 信号 
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Sine Wave 





产生 一 个 正弦 波 信号 





产生 一 个 阶 跃 信号 


续 表 
图 “ 标 模块 名 功能 
Pulse Generator 脉冲 发 生 器 
中 Ramp 斜坡 输入 
Signal Builder 信号 创建 器 
666 
00 Signal Generator 产生 各 种 不 同 的 波形 


Sep 





Unitorm Random Number 





(2 ) 连续 模块 





产生 一 致 随机 数 





过 程控 制 系统 仿真 中 ， 连 续 模块 ( Continuous ) 中 常用 的 子 模块 如 表 5-2 所 示 。 


表 5-2 ”常用 的 连续 模块 





Derivative 








输入 信号 微分 



































Integrator 输入 信号 积分 
State-Space 状态 空间 系统 模型 
[ 去 Transfer Fcn 传递 函数 模型 
以 Transport Delay 国定 时 间 传输 延迟 
2 
二 Variablc Transport Delay 可 变 时 间 传输 延迟 





Zero-Pole 











办 极点 模型 





(3 ) 数学 运算 模块 


过 程控 制 系统 仿真 中 ， 数 学 运算 模块 ( Math Operations ) 中 常用 的 子 模块 如 表 5-3 所 示 。 
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表 5-3 ”常用 的 数学 运算 模块 
图 “ 标 模块 名 功能 


























对 输入 信号 进行 除法 运算 








对 输入 信号 进行 点 鳞 运 算 








上 


对 输入 信号 乘 以 一 个 常数 增益 








Math Function | 人 对 数 函数 、 求 平方 、 开 根 号 等 常用 数学 函数 








MinMax 最 值 运算 






































(4 ) 非 连续 模块 
过 程控 制 系统 仿真 中 ， 非 连续 模块 ( Discontinuous ) 中 常用 的 子 模块 如 表 5-4 所 示 。 


表 5-4 常用 的 非 连续 模块 













































四 Backlash 间 阶 非 线 性 
于 Coulomb & Viscous Friction 库仑 和 业 度 摩擦 非 线性 
[ 思 Dead Zone 死 区 非 线性 
Dead Zone Dynamic 动态 死 区 非 线性 
于 Hit Crossing ] 冲击 非 线性 
Quantizer 量化 非 线性 
芽 引 Relay 继 电 非 线性 
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续 表 





模块 名 








Saturation 


饱和 非 线性 











Saturation Dynamic 


动态 饱和 非 线性 





(5 ) 离散 系统 模块 


过 程控 制 系统 仿真 中 ， 离 散 系统 模块 ( Discrete ) 中 常用 的 子 模块 如 表 5-5 所 示 。 


表 5-5 ”常用 的 离散 系统 模块 



















































































图 “ 标 
z1 
攻 | 
K 人 1 
人 Discrete Derivative 离散 微分 环节 
上 产 -- 一 一 
1 
1051 Discrete Fiher 离散 滤波 器 
mj=Cxtni+Dutm 
xn+1)<Axtn)+Bufn) Diserete Suate -Space 离散 状态 空间 系统 模型 
1 
Discrete Transfer-Fcn 离 艇 传递 函数 模型 
Discrete Zero-Pole 以 零 极点 表示 的 离 艇 传递 函数 模型 
Discrete-time Integrator 离散 时 间 积分 器 
First-Order Hold 一 阶 保持 器 
0.05z 
05 Transfer Fen First Order 离散 一 阶 传递 函数 
ED 
和 Transfer Fcn Real Zero 离散 零点 传递 函数 
1 
本 Unit Delay 一 个 采样 周期 的 延迟 
了 Zero-Order Hold 零 阶 保持 器 
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(6 ) 给 出 显示 部 分 模块 


过 程控 制 系统 仿真 中 ， 输 出 显示 部 分 模块 常用 的 是 接收 器 模块 ( Sinks )， 其 中 常用 的 
子 模 块 如 表 5-6 所 示 。 





表 5-6 常用 的 输出 显示 模块 














Display 











Floating Scope 








Outl 




















Scope 











To FileCman 将 数据 输出 到 文件 中 











To Workspace 将 数据 输出 到 MATLAB 的 工作 空间 中 





XY Graph 在 MATLAB 图 形 窗口 中 显示 信号 的 X-Y 图 








仿真 模型 及 仿真 过 程 








1. Simulink 仿真 模型 组 成 

一 个 典型 的 Simulink 仿真 模型 由 以 下 三 种 类 型 的 模块 构成 。 

(1 ) 信号 源 模块 

信号 源 为 系统 的 输入 , 它 包括 常数 信号 源 、 函 数 信号 发 生 器 ( 如 正弦 波 和 阶 跃 函数 等 ) 
和 用 户 自己 在 MATLAB 中 创建 的 自 定义 信号 。 

(2 ) 被 模拟 的 系统 模块 

系统 模块 作为 仿真 的 中 心 模块 ， 它 是 Simulink 仿真 建 模 所 要 解决 的 主要 部 分 。 

(3) 输出 显示 模块 

系统 的 输出 由 显示 模块 接收 。 输 出 显示 的 形式 包括 图 形 显 示 、 示 波 器 显示 和 输出 到 文 
件 或 MATLAB 工作 空间 中 三 种 ， 输 出 模块 主要 在 Sinks 库 中 。 

构成 Simulink 仿真 模型 的 三 种 模块 的 关联 图 如 图 5-5 所 示 。 

[ ] 训 本 59 
下 广 -一 一 一 村 红 机 的 -一 一 一 铂 出 显示 模块 | 








| 





图 5-5 Simulink 仿真 模型 的 结构 关联 图 


84 > = 乱入 


第 有 章 Simulink 仿真 入 门 





Simulink 仿真 模型 的 基本 特点 可 归纳 如 下 

(1) Simulink 里 提供 了 许多 如 Scope { 示波器 ) 的 接收 器 模块 ， 这 使 得 用 Simulink 进 
行 仿真 具有 像 做 实验 一 般 的 图 形 化 显示 效果 。 

(2 ) Simulink 的 模型 具有 层次 性 ， 通 过 底层 子 系统 可 以 构建 上 层 母 系统 。 

(3 ) Simulink 提供 了 对 子 系统 进行 封装 的 功能 ， 用 户 可 以 自 定义 子 系统 的 图 标 和 设置 
参数 对 话 框 。 
2. Simulink 仿真 的 基本 过 程 

启动 Simulink 后 , 便 可 在 Simulink 中 进行 建 模仿 真 。Simulink 建 模仿 真 的 基本 过 程 如 
下 : 

人 @ 打开 一 个 空白 的 Simulink 模型 窗口 。 

名 进入 Simulink 模块 库 浏览 界面 ， 将 相应 模块 库 中 所 需 的 模块 拖 到 编辑 窗口 里 。 具 
体 的 操作 是 : 用 鼠标 左 键 选中 所 需要 的 模块 ， 然 后 将 其 拖 到 需要 创建 仿真 模型 的 窗口 ， 松 
开 恨 标 ， 这 时 所 需要 的 模块 就 出 现在 Simulink 模型 窗口 中 。 

全 照 给 定 的 框图 修改 编辑 窗口 中 模块 的 参数 。 在 Simulink 环境 下 绘制 模块 ， 只 能 绘 
出 带 有 默认 参数 的 模型 ， 为 了 满足 用 户 的 具体 需要 ， 有 时 还 需要 对 模块 参数 进行 具体 的 设 
置 。 要 对 模块 进行 参数 设置 ， 首 先 双击 该 模块 ， 打 开 此 模块 的 参数 设置 对 话 框 ， 然 后 在 该 
参数 设置 对 话 框 中 ， 查 看 模块 的 各 项 默认 参数 设置 ， 或 者 根据 需要 修改 各 项 参数 设置 。 

人 @ 将 各 个 模块 按 给 定 的 框图 连接 起 来 ， 搭 建 所 需要 的 系统 模型 。 

全 用 菜单 或 命令 窗口 输入 命令 进行 仿真 分 析 ， 在 仿真 的 同时 ， 可 以 观察 仿真 结果 ， 
如 果 发 现 有 不 正确 的 地 方 ， 可 以 停止 仿真 ， 对 参数 进行 修正 。 

人 @@ 如 果 对 结果 满意 ， 可 以 将 模型 保存 。 

下 面 通过 一 个 简单 的 模型 来 讲述 Simulink 建 模仿 真 的 基本 操作 过 程 。 


【 例 5-1】 利用 Simulink 设计 一 个 简单 的 模型 , 其 功能 是 将 一 个 正弦 信号 输出 到 示 波 
器 中 。 
解 : 解 题 的 基本 步骤 如 下 所 述 。 


人 @@ 新 建 一 个 模型 窗口 。 






全 为 模型 添加 所 需 模块 。 从 源 模块 库 ( Sources ) 中 复制 正弦 波 模块 ( sin 
训 ) 

输出 显示 模块 库 ( Sinks ) 复制 示波器 模块 ( ss。 )。 
盒 连接 相关 模块 ， 构 成 所 需要 的 系统 模型 ， 如 图 5-6 所 示 。 


岛 加 


Sine Wave Scope 
图 5-6 ”正弦 信号 输出 到 示波器 中 的 模型 
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合 进行 系统 仿真 ， 单 击 模型 窗口 菜单 中 的 “Simulation” 一 “Start"， 执 行 仿真 。 
命 观察 仿真 结果 。 双 击 示波器 模块 , 打开 Scope 窗口 ， 结果 为 如 图 5-7 所 示 的 正弦 波 。 
0 Ra Eee 葡 
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图 5-7 示波器 中 的 仿真 结果 


_Simulink 模块 的 处 理 . 


将 仿真 所 需 的 模块 从 各 自 的 模块 库 中 拖 到 新 建 的 模型 窗口 后 ， 需 要 对 这 些 模 块 进行 处 
理 ， 包 括 设置 模块 参数 、 连 接 模块 等 ， 然 后 才能 构建 仿真 系统 。 
5.3.1 _ Simulink 模块 参数 设置 


1， 功能 模块 参数 的 设置 


在 设置 功能 模块 参数 后 ， 才 能 进行 仿真 操作 。 不 同 功能 模块 的 参数 是 不 同 的 ， 用 鼠标 
双击 该 功能 模块 会 弹出 相应 的 参数 设置 对 话 框 。 图 5-8 是 传输 延迟 功能 模块 的 对 话 框 。 





图 5-8 ”功能 模块 参数 设置 对 话 框 


功能 对 话 框 由 功能 模块 说 明 框 和 参数 设置 框 组 成 。 
( 1 ) 功能 模块 说 明 框 用 于 说 明 该 功能 模块 使 用 方法 和 功能 。 
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( 2 ) 参数 设置 框 用 于 设置 该 功能 模块 的 参数 。Simulink 中 几乎 所 有 模块 的 参数 
({ Parameter ) 都 允许 用 户 进行 设置 ， 只 要 双击 要 设置 参数 的 模块 就 会 弹出 设置 对 话 框 。 
例如 图 5-8 中 ,“Transport Delay” 说 明 框 中 有 该 模块 的 英文 说 明 ，"Parameters" 说 明 框 
由 “Time Delay”( 延迟 时 间 入 “Initial output”( 初始 输出 人 “Initial buffer size”( 初始 缓冲 
区 的 大 小 ) 和 Pade order ( pade 近似 的 阶 次 ) 组 成 ， 用 户 可 输入 相关 参数 。 每 个 对 话 框 的 下 
面 有 “OK”( 确认 入 “Cancel”( 取消 人 “Help”( 帮助 ) 和 “Apply”( 应 用 ) 4 个 按钮 。 
“设置 功能 模块 参数 后 ， 需 单 击 “OK” 按 钮 进行 确认 ， 将 设置 参数 送 到 仿真 操作 画 
面 ， 并 关闭 对 话 框 。 
。* 单 击 “Cancel” 按 钮 将 取消 刚才 输入 的 设置 参数 ， 并 关闭 对 话 框 。 
。 单 击 “Help” 按 钮 ， 将 弹出 Web 求助 画面 。 
。* 单 击 “Apply” 按 钮 将 设置 参数 送 仿真 操作 画面 ， 但 不 关闭 参数 设置 对 话 框 。 
2 示波器 参数 设置 
采用 Simulink 仿真 时 ， 示 波 器 可 以 接收 向 量 信号 ， 实 时 显示 信号 波形 ， 但 该 波形 不 能 
直接 打印 或 馈 入 文件 , 示波器 显示 的 结果 直观 且 方便 ,是 最 常用 的 现实 仿真 结果 的 工具 之 一 。 
图 5-9 为 示波器 中 显示 的 正弦 波形 ， 示 波 器 窗口 的 标题 是 “Scope"， 标 题 栏 下 是 工具 
栏 ， 下 面 简要 介绍 一 下 工具 栏 。 
娘 岂 局 : 这 3 个 图 标 按钮 分 别管 理 x-y 双向 变焦 ( Zoom )、x 轴 向 变焦 ( Zoom X 和 y 
轴 向 变焦 ( Zoom y ) 
败 :管理 纵 坐 标的 自动 刻度 ( Autoscale )， 取 当前 信号 的 最 大 和 最 小 值 分 别 为 纵 坐 标的 
上 下 限 。 
国 :把 当前 轴 的 设置 保存 为 该 示波器 的 默认 设置 。 
贸 : 打开 示波器 属性 对 话 框 。 








图 5-9 示波器 中 的 正弦 波形 


在 示波器 “坐标 框 ” 内 ， 单 击 鼠 标 右键 ， 弹 出 一 个 现场 菜单 ， 选 中 菜单 项 “Axes 
properties"， 又 引出 纵 坐标 设置 对 话 框 。 在 “Ymin” 和 “Ymax"” 栏 中 可 填写 所 希望 的 纵 轴 
下 、 上 限 。 

单 击 示波器 工具 栏 上 的 久 按钮 ， 打 开 如 图 5-10 所 示 的 示波器 属性 对 话 框 。 
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图 5-10 ”示波器 属性 对 话 框 


影响 横 坐 标 显示 的 参数 如 下 

。Number of axes: 多 信号 显示 区 设置 。 

e。 Time range， 默 认为 10， 即 显示 在 [0，10] 区 间 的 信号 。 

e Sampling: 包含 两 个 下 拉 菜 单项 ， 抽 选 ( Decimation ) 和 采样 时 间 ( Sample time )o 
“Decimation” 设置 显示 频 度 , 若 取 n, 表示 每 隔 (n-D) 个 数据 点 给 予 显示 ; “Sampling 
time” 设 置 显示 点 的 采样 时 间 步 长 。 默 认 值 为 0， 表示 显示 连续 信号 。 

。 Limit row tolast， 设 定 缓冲 区 接收 数据 的 长 度 。 默 认为 勾 选 状态 ， 其 值 为 5000。 

Save data to workspace: 默认 时 ， 不 被 勾 选 。 若 该 栏 被 勾 选 ， 则 可 把 示波器 缓冲 区 中 
保存 的 数据 以 矩阵 或 构架 形式 ， 送 入 MATLAB 工作 空间 。 


5.3.2 Simulink 模块 基本 操作 


模块 是 建立 Simulink 模型 的 基本 单元 ， 用 适当 的 方法 把 各 种 模块 连接 在 一 起 就 能 够 建 
立 任何 动态 系统 的 模型 。Simulink 模块 的 基本 操作 有 选取 、 复 制 、 删除 、 外 形 调整 和 模块 
名 处 理 、 颜 色 设 定 、 属 性 设 定 等 ， 下 面 分 别 进 行 介绍 
1. 模块 选取 

当选 取 单个 模块 时 ， 只 要 用 鼠标 在 模块 上 单 击 即 可 ， 这 时 模块 图 标的 4 个 角 上 出 现 黑 
色 的 小 方块 。 选 取 多 个 模块 时 ， 在 所 有 模块 所 占 区 域 的 一 角 按 下 鼠标 左 键 不 放 ， 拖 向 该 区 
域 的 对 角 ， 在 此 过 程 中 会 出 现 虚 框 ， 当 虚 框 包 住 了 要 选 的 所 有 模块 后 ， 放 开 鼠标 左 键 ， 这 
时 在 所 有 被 选 模块 的 图 标 上 都 会 出 现 小 黑 方块 ， 表 示 模 块 被 选中 了 。 
2.， 模块 复 制 

模块 可 以 在 同一 窗口 内 复制 ， 也 可 以 在 不 同窗 口 之 间 复 制 。 

(1) 在 同一 个 模型 窗口 内 复制 

有 时 一 个 模型 需要 多 个 相同 的 模块 ， 复 制 方法 有 如 下 3 种 : 

。 用 鼠标 左 键 单 击 要 复制 的 模块 ， 按 住 左 键 ， 移 动 鼠 标 ， 同 时 技 下 Ctrl 键 ， 到 适当 位 

置 释放 鼠标 ， 该 模块 就 被 复制 到 当前 位 置 。 
。 更 简单 的 方法 是 ， 先 选中 模块 ， 再 按 住 鼠 标 右键 ( 不 按 Cl 键 ) 移动 鼠标 ， 便 可 实 
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现 复制 。 
。 还 有 一 种 方法 是 ， 先 选 定 要 复制 的 模块 ， 选 择 “Edit” 菜 单 下 的 “Copy” 命 令 ， 然 
后 选择 “Paste” 命 令 。 
(2 ) 在 不 同 的 窗口 之 间 复 制 
当 建立 模型 时 ， 需 要 从 模块 库 窗口 ， 或 者 已 经 存在 的 窗口 把 需要 的 模块 复制 到 新 建 模 
型 文件 的 窗口 。 要 对 已 经 存在 的 模块 进行 编辑 时 ， 有 时 也 需要 从 模块 库 窗 口 或 另 一 个 已 经 
存在 的 模型 窗口 复制 模块 。 复 制 方法 有 如 下 2 种 ， 
。 最 简单 的 办 法 是 ， 用 鼠标 左 键 选 择 要 复制 的 模块 { 首先 要 打开 源 模块 和 目标 模块 所 
在 的 窗口 )， 按 住 左 键 ， 移 动 鼠标 到 相应 窗口 ( 不 用 按 住 Ctrl 键 )， 然 后 释放 ， 该 模 
块 就 会 被 复制 过 来 ， 而 源 模块 不 会 被 删除 。 
。 使 用 “Edit” 菜 单 的 “Copy” 和 “Paste” 命 令 来 完成 复制 。 先 选 定 要 复制 的 模块 ， 
选择 “Edit” 菜 单 下 的 “Copy” 命 令 ， 然 后 切换 到 目标 窗口 的 “Edit” 菜单 下 选择 
“Paste” 命 令 。 


洗 守 复制 结果 中 会 发 现 复制 出 的 模块 名 称 在 原名 称 的 基础 上 又 加 了 编号 记 这 是 
Simutink 的 约定 ,每 个 模型 中 的 模块 和 名 称 是 一 一 对 应 的 ,相同 的 模块 或 不 同 
的 模块 都 不 能 用 同一 个 名 字 
3， 模块 删除 
选中 模块 ， 按 Delete 键 即 可 。 若 要 删除 多 个 模块 ， 可 以 同时 按 住 Shift 键 ， 再 用 鼠标 
选中 多 个 模块 ， 按 Delete 键 即 可 ; 也 可 以 用 鼠标 选取 某 区 域 ， 再 按 Delete 键 就 可 以 把 该 区 
域 中 的 所 有 模块 和 线 等 全 部 删除 。 
4. 模块 外 形 的 调整 
模块 外 形 的 调整 有 大 小 的 改变 、 方 向 的 改变 和 添加 阴影 。 
(1) 改变 大 小 
选 定 模块 ， 用 鼠标 选择 其 周围 的 四 个 黑 方块 中 的 任意 一 个 ， 拖 动 鼠 标 ， 这 时 会 出 现 虚 
线 的 矩形 表示 新 模块 的 位 置 ， 调 整 到 需要 的 大 小 后 释放 鼠标 即 可 。 
(2 ) 改变 方向 
为 了 能 够 顺序 连接 功能 模块 的 输入 和 输出 端 ， 功 能 模块 有 时 需要 转向 。 在 菜单 
“Format” 中 选择 “Flip Block” 旋 转 180。 ， 选 择 “Rotate Block” 上 顺 时 针 旋转 90。 ; 或 者 
直接 按 Ctrli+F 组 合 键 执行 “Flip Block"， 按 Ctrl+R 组 合 键 执行 “Rotate Block"。 
(3 ) 给 模块 加 阴影 
选 定 模块 ， 选 取 菜单 “Format” 下 的 “Show Drop Shadow” 使 模块 产生 阴影 效果 。 


5. 模块 名 的 处 理 
模块 名 的 处 理 包括 名 称 的 显示 与 否 、 修 改 和 改变 模块 名 位 置 等 。 
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(1) 是 否 显示 模块 名 

选取 菜单 “Format” 下 的 “Hide Name" ， 模 块 名 就 会 被 隐藏 ， 同 时 “Hide Name” 改 
为 “Show Name "。 

选取 “Show Name” 就 会 使 模块 隐藏 的 名 字 显示 出 来 。 

(2 ) 修改 模块 名 

单 击 模块 名 的 区 域 ， 会 在 此 处 出 现 编辑 状态 的 光标 ， 在 这 种 状态 下 能 够 对 模块 名 随意 
修改 。 

模块 名 和 模块 图 标 中 的 字体 也 可 以 更 改 ， 方 法 是 选 定 模块 ， 在 菜单 “Format” 下 选取 
*Font"， 这 时 会 弹出 “Set Font” 对 话 框 ， 在 对 话 框 中 可 选取 想 要 的 字体 。 

(3 ) 改变 模块 名 的 位 置 

模块 名 的 位 置 有 一 定 的 规律 ， 当 模块 的 接口 在 左右 两 侧 时， 模块 名 只 能 位 于 模块 的 上 
下 两 侧 ， 默 认 在 下 侧 ， 当 模块 的 接口 在 上 下 两 侧 时 ， 模 块 名 只 能 位 于 模块 的 左右 两 侧 ， 默 
认 在 左 侧 。 

因此 模块 名 只 能 从 原 位 置 移 到 相对 的 位 置 。 可 以 用 鼠标 拖 动 模块 名 到 其 相对 的 位 置 
也 可 以 选 定 模块 ， 用 菜单 “Format” 下 的 “Flip Name” 命 令 实现 相同 的 移动 。 
6. 模块 颜色 的 设置 

"Format” 菜 单 中 的 “Foreground Color” 命 令 可 以 改变 模块 的 前 景 颜色 ， ”Background 
Color" 命令 可 以 改变 模块 的 背景 颜色 ， 而 模型 窗口 的 颜色 可 以 通过 “Screen Color” 命 令 
来 改变 。 
7. 模块 属性 的 设置 

选中 模块 ， 通 过 “Edit” 菜单 的 “Block Properties” 命 令 可 以 对 模块 进行 属性 的 设置 ， 
包括 对 Description、Priority、Tag、Open function、Attributes format string 等 属性 的 设置 。 

其 中 Open function 属性 是 一 个 很 有 用 的 属性 ， 通过 它 指定 一 个 函数 名 ; 当 模块 被 双击 
之 后 ，Simulink 就 会 调用 该 函数 并 执行 ， 这 种 函数 在 MATLAB 中 称 为 回调 函数 。 





5.3.3 _ Simulink 模块 连接 


上 面 介绍 了 对 模块 本 身 的 各 种 操作 ， 当 设置 好 各 个 模块 后 ， 还 需要 把 它们 按照 一 定 的 
顺序 连接 起 来 才能 组 成 一 个 完整 的 系统 模型 。 
1. 模块 间 连 线 

在 模块 间 连 线 ， 有 以 下 几 种 情况 。 

(1) 连接 两 个 模块 

从 一 个 模块 的 输出 端 连 到 另 一 个 模块 的 输入 端 ， 这 是 最 基本 的 连接 情况 。 方 法 是 将 光 
标 移动 到 输出 端 ， 光 标的 箭头 会 变 成 十 字形 光标 ， 这 时 按 住 鼠 标 左 键 不 放 ， 移 动 光标 到 另 
一 个 模块 的 输入 端 ， 当 十 字 光 标 出 现 “ 重 影 ” 时 ， 释 放 鼠 标 左 键 就 完成 了 连接 。 
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如 果 两 个 模块 不 在 同一 水 平 线 上 ， 连 线 是 一 条 折线 。 如 果 要 用 斜 线 表示 ， 必 须 在 连接 
时 按 住 Shift 键 。 

(2 ) 模块 间 连 线 的 调整 

调整 模块 间 连 线 位 置 可 利用 鼠标 简单 的 拖 动 来 实现 ， 即 先 把 光标 移 到 需要 移动 的 线段 
的 位 置 ， 按 住 鼠 标 左 键 ， 再 把 光标 移动 到 目标 位 置 ， 释 放 和 鼠标 左 键 。 

还 有 一 种 情况 是 要 把 一 条 直线 分 成 斜 线段 ， 调 整 方法 和 前 一 种 情况 类 似 ， 不 同 之 处 在 
于 按 住 鼠 标 之 前 要 先 按 下 Shift 键 ， 出 现 小 黑 方 框 之 后 ， 用 鼠标 左 键 选 择 小 黑 方 框 ， 按 下 
左 键 不 放 并 移动 鼠标 ， 移 动 到 适当 的 位 置 后 释放 Shift 键 和 鼠标 。 

(3 ) 在 连 线 之 间 插 入 模块 

把 该 模块 用 鼠标 拖 到 连 线 上 ， 然 后 释放 鼠标 即 可 。 

(4 ) 连 线 的 分 支 

这 是 经 常会 碰 到 的 一 些 情况 ， 即 需要 把 一 个 信号 输送 到 不 同 的 模块 ， 这 时 就 需要 使 用 
分 支 结构 的 连 线 。 例 如 要 把 正弦 波 信号 实时 显示 出 来 ， 同 时 还 要 将 信号 数据 存 到 文件 。 

操作 步骤 是 : 在 先 连 好 一 条 线 以 后 ， 把 鼠标 移 到 支线 的 起 点 位 置 ， 先 按 下 鼠标 左 键 ， 
然后 按 住 Ctrl， 将 鼠标 拖 到 目标 模块 的 输入 端 ， 最 后 释放 鼠标 和 Ctrl 键 。 
2. 在 连 线 上 标示 信息 

在 连 线 上 标示 信息 包括 标示 向 量 、 显 示 数 据 类 型 和 信号 标记 等 。 

(1) 标示 向 量 

为 了 能 比较 直观 地 区 别 各 个 模块 之 间 传 输 的 数据 是 数据 还 是 矩阵 ( 向 量 )， 可 以 选 
择 模 型 文件 菜单 “Format” 下 的 “Wide vector Lines” 选 项 ， 这 样 传输 向 量 的 连 线 就 会 
变 粗 。 

如 果 再 选择 “Format” 下 的 “Vector Lines Widths” 选 项 ， 在 传输 矩阵 的 连 线 上 方 会 显 
示 出 通过 该 连 线 的 矩阵 维 数 。 

(2 ) 显示 数据 类 型 

在 连 线 上 可 以 显示 一 个 模块 输出 的 数据 类 型 ,选择 菜单 "Format" 下 的 "Port Data Types” 
选项 即 可 实现 。 

(3 ) 信号 标记 

为 了 使 模型 更 加 直观 、 可 读 性 更 强 ， 可 以 为 传输 的 信号 做 标记 。 建 立信 号 标记 的 办 法 
是 : 双击 要 做 标记 的 线段 ， 出 现 一 个 小 文本 编辑 框 ， 在 里 面 输入 标记 的 文本 ， 这 样 就 建立 
了 一 个 信号 标记 。 信 号 标记 可 以 随 信 号 的 传输 在 一 些 模块 中 传递 。 

支持 这 种 传递 的 模块 有 Mux、Demux、Inport、From、Selector、Subsystem 和 Enable。 

要 实现 信号 标记 的 传递 ， 需 要 在 上 面 列 出 的 某 个 模块 的 输出 端 建立 一 个 以 “<” 开 头 
的 标记 。 当 开始 仿真 或 执行 “Edit” 菜 单 下 的 “Updata Diagram” 命 令 时 ， 传 输 过 来 的 信号 
标记 就 会 显示 出 来 。 
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有 simuink 仿真 设 各 


在 编辑 好 仿真 程序 后 ， 应 设置 仿真 操作 参数 ， 以 便 进行 仿真 。 单 击 “Simulation” 菜 
单 下 面 的 “Configuration Parameters” 项 或 者 直接 按 快捷 键 Crl+E， 便 弹出 如 图 5-11 所 示 
的 设置 界面 , 它 包括 仿真 器 参数 ( Solver ) 设 置 、 工 作 空间 数据 导入 /导出 ( Data ImporVExport ) 
设置 等 。 下 面 对 控 制 系统 仿真 中 常用 的 仿真 设置 进行 介绍 。 
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图 5-11 Simulink 设置 窗口 


5.4.1 ”仿真 器 参数 设置 


可 以 设置 仿真 开始 时 间 、 仿 真 结束 时 间 、 解 法 器 及 输出 项 等 仿真 器 参数 。 对 于 一 般 的 
仿真 ， 使 用 默认 设置 即 可 。 


1. 仿真 时 间 (Simulation time) 设置 

这 里 所 指 的 时 间 概 念 与 真实 的 时 间 并 不 一 样 ， 只 是 计算 机 仿真 中 对 时 间 的 一 种 表示 ， 
比如 10s 的 仿真 时 间 ， 如 果 采 样 步 长 定 为 0.1， 则 需要 执行 100 步 ， 若 把 步 长 减 小 ， 则 采 
样 点 数 增加 ， 那 么 实际 的 执行 时 间 就 会 增加 。 

通常 需要 设置 仿真 开始 时 间 ( Start time ) 和 仿真 结束 时 间 ( Stop time )。 一 般 仿 真 开始 
时 间 设 为 0， 而 结束 时 间 则 视 不 同 的 情况 进行 选择 。 

总 的 说 来 ， 执 行 一 次 仿真 要 耗费 的 时 间 取决 于 很 多 因素 ， 包 括 模型 的 复杂 程度 、 解 法 
器 及 其 步 长 的 选择 、 计 算 机 时 钟 的 速度 等 。 


2. 仿真 步 长 模式 设置 

在 图 5-11 所 示 界 面 “Type” 下 拉 选 项 框 中 指定 仿真 的 步 长 方式 ， 可 供 选择 的 有 
Variable-step ( 变 步 长 ) 和 Fixed-step ( 固定 步 长 ) 方式 。 

选择 变 步 长 模式 则 可 以 在 仿真 过 程 中 改变 步 长 ， 提 供 误差 控制 和 过 零 检 测 选择 。 固 定 
步 长 模式 则 可 以 在 仿真 过 程 中 提供 固定 的 步 长 ， 不 提供 误差 控制 和 过 零 检 测 。 
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3 解法 器 设置 

在 “Solver” 下 拉 选 项 框 中 选择 解法 器 。 可 选 的 变 步 长 模式 解法 器 有 : discrete、ode45、 
ode23、ode113、ode15s、ode23s、ode23t 和 ode23tb。 下 面 简要 概述 一 下 这 些 解法 器 的 含义 。 

(1 ) discrete: 当 Simulink 检查 到 模型 没有 连续 状态 时 使 用 它 。 

( 2 ) ode45: 默认 值 ， 表 示 四 /五 阶 龙 格 - 库 塔 法 ， 适 用 于 大 多 数 连 续 或 离散 系统 ， 但 不 
适用 于 刚性 ( stiff ) 系统 。 它 是 单 步 解法 器 ， 即 在 计算 y(t,) 时， 它 仅 需要 最 近 处 理 时 刻 的 
结果 >(t,)。 一 般 来 说 ， 面 对 一 个 仿真 问题 最 好 首先 试 试 ode45。 

( 3 ) ode23: 表示 二 /三 阶 龙 格 - 库 塔 法 ， 它 在 误差 限 要 求 不 高 和 求解 的 问题 不 太 难 的 情 
况 下 ， 可 能 会 比 ode45 更 有 效 。 它 也 是 一 个 单 步 解法 器 。 

(4 ) ode113: 表示 一 种 阶 数 可 变 的 解法 器 ， 它 在 误差 容许 要 求 严 格 的 情况 下 通常 比 
ode45 有 效 。ode113 是 一 种 多 步 解法 器 ， 即 在 计算 当前 时 刻 输出 时 ， 它 需要 以 前 多 个 时 刻 
的 解 。 

( 5 ) ode15s: 表示 一 种 基于 数字 微分 公式 的 解法 器 ( NDFs )， 它 也 是 一 种 多 步 解法 器 ， 
适用 于 刚性 系统 。 当 用 户 估计 要 解决 的 问题 是 比较 困难 的 、 不 能 使 用 ode45 或 者 即使 使 用 
效果 也 不 好 时 ， 就 可 以 用 odel5s。 

(6 ) ode23s: 表示 一 种 单 步 解法 器 ， 专 门 应 用 于 刚性 系统 ， 在 弱 误 差 允许 下 的 效果 优 
于 ode15s。 它 能 解决 某 些 ode15s 所 不 能 有 效 解 决 的 刚性 问题 。 

(7 ) ode23t;， 表示 梯形 规则 的 一 种 自由 插值 实现 。 这 种 解法 器 适用 于 求解 适度 刚性 而 
用 户 又 需要 一 个 无 数字 振荡 的 解法 器 的 情况 。 

( 8 ) ode23tb: 表示 TR-BDF2 的 一 种 实现 ，TR-BDF2 是 具有 两 个 阶段 的 隐 式 龙 格 - 库 
塔 公式 。 

固定 步 长 模式 解法 器 有 : discrete、ode5、ode4、ode3、ode2、odel 和 ode14x。 

(1 )discrete: 表示 一 种 实现 积分 的 固定 步 长 解法 器 , 它 适 合 于 离散 无 连续 状态 的 系统 。 

(2 ) ode5: 默认 值 ， 是 ode45 的 固定 步 长 版 本 ， 适 用 于 大 多 数 连 续 或 离散 系统 ， 不 适 
用 于 刚性 系统 。 

(3 ) ode4: 表示 四 阶 龙 格 - 库 塔 法 ， 具 有 一 定 的 计算 精度 。 

(4 ) ode3: 表示 固定 步 长 的 二 /三 阶 龙 格 - 库 塔 法 。 

( 5 ) ode2: 表示 改进 的 欧 拉 法 。 

(6 ) ode1: 表示 欧 拉 法 。 

(7 ) ode14x: 表示 固定 步 长 的 隐 式 外 推 法 。 


4， 变 步 长 的 参数 设置 

对 于 变 步 长 模式 ， 用 户 常用 的 设置 有 :“Max step size”( 最 大 步 长 参数 ) 和 “Min step 
size”( 最 小 步 长 参数 人 “Relative tolerance”( 相对 误差 ) 和 “Absolute tolerance”( 绝对 误 
差 和 初始 步 长 ， 以 及 “Zero crossing control”( 过 零 控制 )。 默 认 情 况 下 ， 步 长 自动 确定 ， 
用 auto 值 表示 。 

(1 ) Max step size: 决定 解法 器 能 够 使 用 的 最 大 时 间 步 长 ， 它 的 默认 值 为 “仿真 时 
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间 /50"， 即 整个 仿真 过 程 中 至 少 取 50 个 取样 点 。 这 样 的 取 法 对 于 仿真 时 间 较 长 的 系统 则 
可 能 带 来 取样 点 过 于 稀 朴 的 问题 ， 继 而 使 仿真 结果 失真 。 一 般 建 议 对 于 仿真 时 间 不 超过 
15s 的 采用 默认 值 即 可 ， 对 于 超过 15s 的 每 秒 至 少 保证 5 个 采样 点 ， 对 于 超过 100s 的 ， 
每 秒 至 少 保证 3 个 采样 点 。 

(2 ) Min step size: 用 来 规定 变 步 长 仿真 时 使 用 的 最 小 步 长 。 

(3 ) Relative tolerance: 指 误差 相对 于 状态 的 值 ， 是 一 个 百分比 ， 默 认 值 为 le-3， 表 
示 状 态 的 计算 值 要 精确 到 0.1%。 

(4 ) Absolute tolerance:， 表示 误差 值 的 门限 ， 或 者 是 在 状态 值 为 零 的 情况 下 可 以 接受 
的 误差 。 如 果 它 被 设 成 了 auto， 那 么 Simulink 为 每 一 个 状态 设置 初始 绝对 误差 为 le-6。 

(5 ) Initial step size， 一 般 建 议 使 用 auto 默认 值 。 

( 6 ) Zero crossing control， 过 零点 控制 ， 用 来 检查 仿真 系统 的 非 连续 。 


5. 固定 步 长 的 参数 设置 

对 于 固定 步 长 模式 ， 用 户 常用 的 设置 如 下 所 述 。 

(1 ) Multitasking: 选择 这 种 模式 时 ， 当 Simulink 检测 到 模块 间 非 法 的 采样 速率 转换 时 
会 给 出 错误 提示 。 所 谓 的 非法 采样 速率 转换 ， 指 两 个 工作 在 不 同 采样 速率 的 模块 之 间 的 直 
接连 接 。 在 实时 多 任务 系统 中 ， 如 果 任务 之 间 存 在 非法 采样 速率 转换 ， 那 么 就 有 可 能 出 现 
一 个 模块 的 输出 在 另 一 个 模块 需要 时 却 无 法 利用 的 情况 。 

通过 检查 这 种 转换 ,Multitasking 将 有 助 于 用 户 建立 一 个 符合 现实 的 多 任务 系统 的 有 效 
模型 。 使 用 速率 转换 模块 可 以 减少 模型 中 的 非法 速率 转换 。Simulink 提供 了 两 个 这 样 的 模 
块 ，unit delay 模块 和 zero-order hold 模块 。 对 于 从 慢 速率 到 快速 率 的 非法 转换 ， 可 以 在 慢 
输出 端口 和 快 输入 端口 插入 一 个 单位 延 时 ( unit delay ) 模块 。 对 于 快速 率 到 慢 速 率 的 转换 ， 
则 可 以 插入 一 个 零 阶 采 样 保 持 器 ( zero-order hold )。 

(2 ) Singletasking: 这 种 模式 不 检查 模块 间 的 速率 转换 ， 它 在 建立 单 任务 系统 模型 时 
非常 有 用 ， 在 这 种 系统 中 不 存在 任务 同步 问题 。 

(3 ) Auto， 选 择 这 种 模式 时 ，Simulink 会 根据 模型 中 模块 的 采样 速率 是 否 一 致 ， 自 动 
决定 切换 到 Multitasking 模式 或 Singletasking 模式 。 


5.4.2 ”工作 空间 数据 导入 /导出 设置 


工作 空间 数据 导入 /导出 ( Data ImporVExport ) 设置 主要 在 Simulink 与 MATLAB 工作 
空间 交换 数值 时 进行 有 关 选 项 设置 , 可 以 设置 Simulink 和 当前 工作 空间 的 数据 输入 或 输出 。 

通过 设置 ， 可 以 从 工作 空间 输入 数据 、 初 始 化 状态 模块 ， 也 可 以 把 仿真 结果 、 状 态 变 
量 、 时 间 数 据 保存 到 当前 工作 空间 , 它 包 括 Load from workspace、Save to workspace 和 Save 
option 三 个 选择 项 。 

(1 ) Load from workspace: 勾 选 该 选项 ， 即 可 从 MATLAB 工作 空间 获取 时 间 和 输入 
变量 ， 一 般 时 间 变量 定义 为 +， 输入 变量 定义 为 ve“Initial state” 用 来 定义 从 MATLAB 工 
作 空 间 获 得 状态 初始 值 的 变量 名 。 
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Simulink 通过 设置 模型 的 输入 端口 ， 实 现在 仿真 过 程 中 从 工作 空间 读 入 数据 ， 常 用 的 
输入 端口 模块 为 信号 与 系统 模块 库 ( Signals 广 Systems ) 中 的 “In1” 模 块 ， 设 置 其 参数 时 ， 
勾 选 “input” 前 的 复 选 框 ， 并 在 后 面 的 编辑 框 输入 数据 的 变量 名 ， 并 可 以 用 命令 窗口 或 M 
文件 编辑 器 输入 数据 。Simulink 根据 输入 端口 参数 中 设置 的 采样 时 间 读 取 输 入 数据 。 

(2 ) Save to workspace: 用 来 设置 存在 MATLAB 工作 空间 的 变量 类 型 和 变量 名 ， 可 以 
选择 保存 的 选项 有 时 间 、 端 口 输出 、 状 态 和 最 终 状态 。 勾 选 该 选项 前 面 的 复 选 框 ， 并 在 选 
项 后 面 的 编辑 框 输入 变量 名 ， 就 会 把 相应 数据 保存 到 指定 的 变量 中 。 常 用 的 输出 模块 为 信 
号 与 系统 模块 库 中 的 “Out1” 模 块 和 输出 方式 库 ( Sink ) 中 的 “To Workspace” 模 块 

( 3 ) Save options， 用 来 设置 存 往 工 作 空 间 的 有 关 选 项 。 

。 Limit rows to last 用 来 设置 Simulink 仿真 结果 最 终 可 存 往 MATLAB 工作 空间 的 变量 

的 规模 ， 对 于 向 量 而 言 即 其 维 数 ， 对 于 矩阵 而 言 即 其 秩 。 

。* Decimation 设 定 了 一 个 亚 采 样 因 子 ， 它 的 默认 值 为 1， 也 就 是 对 每 一 个 仿真 时 间 点 

产生 值 都 保存 ; 若 该 值 为 2， 则 每 隔 一 个 仿真 时 刻 才 保 存 一 个 值 。 

。 Format 用 来 说 明 返 回 数据 的 格式 ， 包 括 数组 ( Array )、 结 构 体 ({ Stucture ) 及 带 时 

间 的 结构 体 ({ Structure with time )。 
。 Signal logging name 用 来 保存 仿真 中 记录 的 变量 名 。 
。 Output options 用 来 生成 额外 的 输出 信号 数据 ， 它 有 以 下 3 个 选项 。 
> Refine output: 这 个 选项 可 以 理解 成 精细 输出 ， 其 意义 是 在 仿真 输出 太 稀 松 时 ， 
Simulink 会 产生 额外 的 精细 输出 , 这 一 点 就 像 插值 处 理 一 样 。 用 户 可 以 在 "Refine 
factor” 设 置 仿真 时 间 步 间 插入 的 输出 点 数 ， 要 产生 更 光滑 的 输出 曲线 ， 改 变 精 
细 因 子 比 减 小 仿真 步 长 更 有 效 。 精 细 输 出 只 能 在 变 步 长 模式 中 才能 使 用 , 并 且 在 
ode45 效果 最 好 。 
)> Produce additional output， 它 允许 用 户 直接 指定 产生 输出 的 时 间 点 。 一 旦 选择 了 
该 项 ， 则 在 它 的 右边 出 现 一 个 “output times” 编 辑 框 ， 在 这 里 用 户 指定 额外 的 仿 
真 输出 点 ， 它 既 可 以 是 一 个 时 间 向 量 ， 也 可 以 是 表达 式 。 与 精细 因子 相 比 ， 这 个 
选项 会 改变 仿真 的 步 长 。 
> Produce specified output only: 它 的 意思 是 让 Simulink 只 在 指定 的 时 间 点 上 产生 
输出 。 为 此 ， 解 法 器 要 调整 仿真 步 长 ， 使 之 和 指定 的 时 间 点 重合 。 这 个 选项 在 比 
较 不 同 的 仿真 时 可 以 确保 它们 在 相同 的 时 间 输 出 。 
。 Refine factor 用 来 指定 仿真 步 长 之 间 产 生 数据 的 点 数 。 


Simulink 仿真 举例 


通过 前 面 的 内 容 , 你 应 该 了 解 并 初步 学 握 了 Simulink 的 使 用 。 使 用 Simulink 仿真 的 基 
本 步骤 如 下 

全 启动 Simulink 并 打开 模型 编辑 窗口 。 

全 将 所 需 模块 添加 到 模型 中 。 
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合 设置 模块 参数 并 连接 各 个 模块 组 成 仿真 模型 。 

合 设置 系统 仿真 参数 。 

合 开始 系统 仿真 。 

(@ 观察 仿真 结果 。 

下 面 通过 几 个 实例 ， 讲 述 如 何 使 用 Simulink 进行 仿真 。 

【 例 5-2】 ”使 用 Simulink 产生 一 个 2s 时 出 现 的 单位 阶 跃 输入 信号 ， 并 在 示波器 中 显 
示 出 来 。 
解 ， 本题 的 基本 求解 步骤 如 下 

人 @ 利用 Simulink 的 “Library" 窗 口中 的 "File" 一 "New”， 
打开 一 个 新 的 模型 窗口 。 

合 分 别 从 信号 源 库 ( Sources )、 输 出 方式 库 ( Sinks ) 





中 ， 用 鼠标 把 阶 跃 信号 发 生 器 ( Step ) 品尝 、 示 波 器 
( Scope ) 问 党 这 两 个 标准 功能 模块 选中 ， 并 将 其 拖 至 模 
型 窗口 。 


全 按 要 求 直接 将 Step 与 Scope 相连 。 

合 双击 Step 模块 ， 打 开 其 属性 设置 对 话 框 ， 并 将 其 中 
的 "Step time” 设 置 为 “2"， 其 他 参数 为 默认 值 ， 如 图 5-12 
所 示 。 图 5-12 ”模块 参数 设置 对 话 杠 

侠 绘制 成 功 后 ， 如 图 5-13 所 示 ， 为 此 文件 命名 并 保存 。 

全 单 击 按钮 对 模型 进行 仿真 ， 运 行 后 ， 双 击 示波器 ， 得 到 图 形 如 图 5-14 所 示 。 








Step Scope 
图 5-13 ”显示 单位 阶 跃 信号 的 Simulink 模型 图 5-14 ”示波器 输出 结果 


从 示波器 中 可 以 看 出 ， 该 信号 是 2s 的 时 产生 的 幅 值 为 1 的 阶 跃 信号 。 


【 例 5-3】 ”使 用 Simulink 求解 微分 方程 ， 坚 =coseinD ，uwO=1。 


解 : 从 数学 的 角度 看 ， 要 由 上 得 到 v 的 数值 解 ， 需 要 先 对 sint 进行 余弦 运算 ， 然 后 再 积分 。 
在 弄 清 数学 模型 结构 之 后 ， 就 可 以 根据 数学 模型 设计 相应 的 仿真 模型 。 

在 本 例 中 , 需要 正弦 信号 、 余 弦 函 数 、 积 分 模块 、 观 测 结果 的 模块 。 从 “Simulink Library 
Browser” 中 分 别 将 这 些 模块 依次 拖 到 “untitled” 窗 口中 ， 如 图 5-15 所 示 。 其 中 有 : 
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。 Sources 模块 组 中 的 Sine Wave 模块 ， 它 产生 正弦 信号 。 

。 Math Operations 模块 组 中 的 Trigonometric Function 模块 ， 这 是 一 个 三 角 函 数 模块 ， 
双击 该 模块 ， 在 弹出 的 对 话 椎 中 选择 余弦 函数 ( cos )。 

。 Continuous 模块 组 中 的 Integrator 模块 ， 它 是 积分 模块 ， 由 于 函数 wx 的 初始 值 为 1， 
也 就 是 说 ， 积 分 器 的 初始 条 件 为 1， 因 此 ， 在 Integrator 的 属性 设置 中 将 “Initial 
condition” 设 置 为 1。 

。 Sinks 模块 组 中 的 Scope 模块 ， 这 是 示波器 模块 ， 能 将 输出 结果 显示 出 来 。 

和 一 一 一 一 一 加 
Sing Wave Tngonometic Intsgrator S5pe 
Function 


图 5-15 求解 微分 方程 的 Simulink 模型 











按照 题 意 连 接 好 模块 后 ， 在 默认 参数 下 运行 ， 输 出 结果 如 图 5-16 所 示 。 


| 必 





图 5-16 ”微分 方程 求解 的 结果 


【 例 5-4】 产生 一 个 Ssin(20 和 sin(50) 丢 加 的 信号 ， 而 且 还 驮 加 功率 谱 为 0.5 的 限 带 宽 
白 噪声 。 
解 ; 首先 需要 产生 sin(20、sin(50 和 限 带 宽 白 噪声 信号 ， 然 后 将 这 3 个 信号 到 加 起 来 。 在 
本 例 中 ， 需 要 正弦 信号 、 限 带宽 白 噪 声 、 加 法 模块 、 观 测 结果 的 模块 。 从 “Simulink Library 
Browser” 中 分 别 将 这 些 模块 依次 拖 到 “untitled” 窗 口中 ， 如 图 5-17 所 示 。 其 中 : 

e Sources 模块 组 中 的 Signal Generator 模块 ， 它 是 信号 发 生 器 模块 。 双 击 该 模块 ， 在 
弹出 的 属性 设置 框 中 ， 选 择 sine 波形 ， 设 置 幅 值 为 5， 频率 为 2， 使 之 产生 5sin(2D 
信号 ;对 另 一 个 信号 发 生 器 模块 做 类 似 的 设置 ， 使 之 产生 sin(50 信 号 。 

。 Sources 模块 组 中 的 Band-Limited White Noise 模块 ， 它 是 限 带 宽 白 噪声 模块 。 双 击 
该 模块 ， 在 弹出 的 属性 设置 框 中 设置 “Noise power”!( 功率 谱 ) 为 0.5， 产 生 功 率 谱 
为 0.5 的 限 带宽 白 噪 声 信号 。 

e Math Operations 模块 组 中 的 Add 模块 ， 它 是 加 法 模块 ， 默 认 是 两 个 输入 相 加 。 双 击 
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该 模块 ， 在 弹出 的 属性 设置 框 中 将 “List of Signs” 框 中 的 两 个 加 号 ( ++ ) 改 为 三 个 
加 号 ( +++ )， 表 明 对 3 个 输入 量 进行 相 加 。 


。 Sinks 模块 组 中 的 Scope 模块 ， 这 是 示波器 模块 ， 能 将 输出 结果 显示 出 来 。 











sn(50 





Band-Limited 
White Noise 


图 5-17 信号 登 加 的 Simulink 模型 


按照 题 意 连接 好 模块 后 ， 在 默认 参数 下 运行 ， 输 出 结果 如 图 5-18 所 示 。 
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图 5-18 信号 鸡 加 的 结果 


通过 以 上 几 个 简单 例子 的 讲述 ， 可 以 总 结 出 利用 Simulink 进行 系统 仿真 的 3 大 步骤 ， 


全 建立 系统 仿真 模型 ， 包 括 添加 模块 、 设 置 模块 参数 以 及 进行 模块 连接 等 操作 。 
全 设置 仿真 参数 。 


全 启动 仿真 并 分 析 仿真 结果 。 
加 3 小 结 


Simulink 是 一 个 非常 友好 的 仿真 工具 ， 入 门 简单 ， 使 用 方便 。 了 解 Simulink 的 构成 ， 
掌握 Simulink 的 基本 操作 ， 是 使 用 Simulink 进行 系统 仿真 的 基础 。 

出 于 篇 幅 的 考虑 , 本 章 只 介绍 了 Simulink 最 常用 、 最 具有 代表 性 内 容 , 对 于 其 他 内 容 ， 
读者 可 在 掌握 这 些 基本 内 容 的 基础 上 ， 通 过 Help 文档 和 反复 练习 ， 触 类 旁 通 ， 达 到 熟练 
掌握 、 运 用 自如 的 境界 。 
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神经 网 络 工具 箱 是 MATLAB 功能 强大 、 应 用 广泛 的 工具 箱 之 一 , 应 用 MATLAB 神经 
网 络 工具 箱 ， 可 以 方便 地 构造 出 适用 于 特定 问题 的 神经 网 络 ， 这 为 神经 网 络 的 实现 提供 了 
一 个 非常 便利 的 操作 环境 和 手段 ， 对 神经 网 络 的 应 用 有 很 大 的 帮助 。 


神经 网 络 简介 


人 工 神经 网 络 ( Artificial Neural Network，ANN )， 亦 称 为 神经 网 络 ( Neural Network， 
NN )， 是 一 种 应 用 类 似 于 大 脑 神经 突 触 连 接 的 结构 进行 信息 处 理 的 数学 模型 ， 在 工程 与 学 
术 界 也 常 直接 简称 为 “神经 网 络 ” 或 “类 神经 网 络 "。 它 是 对 人 脑 的 抽象 、 简 化 和 模拟 ， 
反映 了 人 脑 的 基本 特性 。 神 经 网 络 的 研究 是 从 人 脑 的 生理 结构 出 发 来 研究 人 的 智能 行为 ， 
模拟 人 脑 信息 处 理 的 功能 。 它 是 根植 于 神经 科学 、 数 学 、 统 计 学 、 物 理学 、 计算 机 科学 ， 
以 及 工程 学 科 的 一 门 技术 。 

神经 网 络 是 一 种 运算 模型 ， 由 大 量 的 节点 ( 或 称 神经 元 或 单元 ) 和 相互 之 间 的 加 权 连 接 
构成 。 每 个 节点 代表 二 种 特定 的 输出 函数 ， 称 为 激励 函数 ( activation function )。 每 两 个 节点 
商 的 连接 都 代表 一 个 允 于 通过 该 连 搂 信 写 的 而 权 值 ， 称 芝 为 权重 【WelghtJ 这 和 当 于 种 经 
网 络 的 记忆 。 网 络 的 输出 则 根据 网 络 的 连接 方式 、 权重 值 和 激励 函数 的 不 同 而 不 同 。 而 网 络 
自身 通常 都 是 对 自然 界 某 种 算法 或 者 函数 的 逼近 ， 也 可 能 是 对 一 种 远 辑 策略 的 表达 。 

它 的 构筑 理念 是 受到 生物 { 人 或 其 他 动物 ) 的 神经 网 络 功能 的 运作 启发 而 产生 的 。 人 
工 神经 网 络 通常 是 通过 一 个 基于 数学 统计 学 类 型 的 学 习 方 法 ( Leaming Method ) 得 以 优化 ， 
所 以 神经 网 络 也 是 数学 统计 学 方法 的 一 种 实际 应 用 ， 通过 统计 学 的 标准 数学 方法 我 们 能 够 
得 到 大 量 的 可 以 用 函数 来 表达 的 局 部 结构 空间 ; 另 一 方面 在 人 工 智能 学 的 人 工 感知 领域 ， 
我 们 通过 数学 统计 学 的 应 用 可 以 来 做 人 工 感知 方面 的 决定 问题 ( 也 就 是 说 通过 统计 学 的 方 
法 ， 神经 网 络 能 够 具备 类 似 人 一 样 具 有 简单 的 决定 能 力 和 简单 的 判断 能 力 )， 这 种 方法 比 
起 正式 的 逻辑 学 推理 演算 更 具有 优势 。 

神经 网 络 也 常常 被 称 做 神经 计算 机 ， 但 它 与 现代 数字 计算 机 是 有 所 不 同 的 ， 主要 体现 
在 以 下 方面 ， 

(1 ) 非 线性 。 非 线性 关系 是 自然 界 的 普遍 特性 。 大 脑 的 智慧 就 是 一 种 非 线性 现象 。 人 
工 神经 元 处 于 激活 或 抑制 两 种 不 同 的 状态 ， 这 种 行为 在 数学 上 表现 为 一 种 非 线性 关系 。 具 
有 阅 值 的 神经 元 构成 的 网 络 具 有 更 好 的 性 能 ， 可 以 提高 容错 性 和 存储 容量 。 

( 2 ) 非 局 限 性 。 一 个 神经 网 络 通常 由 多 个 神经 元 广泛 连接 而 成 。 一 个 系统 的 整体 行为 
不 仅 取决 于 单个 神经 元 的 特征 ， 而 且 可 能 主要 由 单元 之 间 的 相互 作用 、 相 互 连 接 所 决定 。 
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通过 单元 之 间 的 大 量 连接 ， 模 拟 大 脑 的 非 局 限 性 。 联 想 记忆 是 非 局 限 性 的 典型 例子 。 

( 3 ) 非常 定性 。 神 经 网 络 具 有 自 适应 、 自 组 织 、 自 学 习 能 力 。 不 仅 神经 网 络 处 理 的 信 
息 可 以 有 各 种 变化 ， 而 且 在 处 理 信息 的 同时 ， 非 线性 动力 系统 本 身 也 在 不 断 变化 。 通 常 采 
用 和 迭代 过 程 描写 动力 系统 的 演化 过 程 。 

(4 ) 非 凸 性 。 一 个 系统 的 演化 方向 ， 在 一 定 条 件 下 将 取决 于 某 个 特定 的 状态 函数 。 例 
如 能 量 函数 ， 它 的 极 值 就 对 应 于 系统 比较 稳定 的 状态 。 非 凸 性 是 指 这 种 函数 有 多 个 极 值 ， 
故 系统 具有 多 个 较 稳定 的 平衡 态 ， 这 将 导致 系统 演化 的 多 样 性 。 

因为 借鉴 了 生物 脑 神经 的 研究 成 果 ， 神 经 网 络 成 为 20 世纪 80 年 代 再 度 活 跃 起 来 的 新 
的 信息 处 理科 学 研究 领域 。 这 与 神经 网 络 是 以 非 线性 处 理 为 基础 分 不 开 的 ， 正 是 由 于 非 线 
性 作用 ， 才 形成 了 大 到 大 自然 ， 小 到 工程 技术 等 系统 的 复杂 性 。 

神经 网 络 涉及 诸多 学 科 的 知识 以 及 应 用 领域 ， 并 在 不 断 的 扩展 之 中 。 本 章 将 从 发 展 历 
史 、 模 型 、 分 类 、 应 用 ， 以 及 MATLAB 工具 箱 的 角度 对 神经 网 络 进行 讲述 ， 以 便 读 者 在 
开始 工具 箱 实例 的 学 习 之 前 对 神经 网 络 理论 有 一 个 整体 的 把 握 。 


| 国 到 神经 网 络 模型 及 训练 


6.2.1 ”生物 神经 元 模型 


人 脑 是 自然 界 所 造就 的 最 高 级 产物 。 人 的 思维 是 由 人 脑 来 完成 的 ， 而 思维 是 人 类 智能 
的 集中 体现 。 人 的 思维 可 概括 为 逻辑 思维 和 形象 思维 两 种 ， 前 者 主要 由 左 脑 掌 管 ， 后 者 则 
由 右 脑 负责 。 

医学 研究 表明 ， 人 类 大 脑 皮层 中 大 约 包含 100 亿 个 神经 元 、60 万 亿 个 神经 突 触 ， 
以 及 它们 的 连接 体 。 神 经 元 之 间 通 过 相互 连接 形成 错综复杂 而 又 灵活 多 变 的 神经 网 络 
系统 。 

神经 系统 的 基本 结构 和 功能 单位 是 神经 细胞 ， 即 神经 元 ( neurons )， 它 主要 由 细胞 体 、 
树 突 、 轴 突 和 突 触 组 成 ， 如 图 6-1 所 示 。 





图 6-1 生物 神经 元 模型 


细胞 体 除 细胞 核 外 ， 还 有 线粒体 、 高 尔 基体 、 尼 氏 体 ( Nissl's bodies ) 等 。 尼 氏 体 颗 
粒状 ， 是 糙 面 内 质 网 和 游离 核糖 体 的 混合 物 ， 神 经 元 的 各 种 蛋白 质 都 是 在 这 里 合成 的 。 细 
胞 质 中 还 有 不 同 走向 的 微 管 、 微 丝 和 密布 的 中 间 纤维 ， 即 神经 元 纤维 ( neurofilaments )o 
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它们 构成 神经 元 的 骨架 ， 有 保持 神经 元 形态 的 作用 。 微 管 还 有 运输 物质 的 功能 。 

神经 元 伸 出 的 突起 分 为 两 种 ， 即 树 突 和 轴 突 。 树 突 ( dendrites ) 短 而 多 分 支 ， 每 支 可 
再 分 支 ， 尼 氏 体 可 深入 树 突 中 ， 树 突 和 细胞 体 的 表 膜 都 有 接受 刺激 的 功能 。 它 们 的 表面 
富有 小 环 状 突起 ， 是 与 其 他 神经 元 的 轴 突 相连 ( 突 触 ) 之 处 。 轴 突 和 树 突 在 形态 和 功能 
上 都 不 相同 。 每 一 个 神经 元 一 般 只 有 一 个 轴 突 ， 从 细胞 体 的 一 个 凸 出 部 分 伸 出 。 轴 突 不 
含 尼 氏 体 ， 轴 突 表面 也 无 羔 状 突起 。 轴 突 一 般 都 比 树 突 长 ， 其 功能 是 把 从 树 突 和 细胞 表 
面 传 入 细胞 体 的 神经 冲动 传 到 其 他 神经 元 或 效应 器 。 所 以 ， 树 突 是 传 入 纤维 ， 轴 突 是 传 
出 纤维 。 

有 些 神经 元 有 一 个 轴 突 和 一 个 树 突 ， 称 为 两 极 神经 元 ， 有 些 神经 元 有 一 个 轴 突 和 多 个 
树 突 ， 称 为 多 极 神经 元 ; 还 有 些 神经 元 只 有 一 条 纤维 ， 称 为 单 极 神经 元 。 如 和 人 和 其 他 兰 椎 
动物 养神 经 中 的 感觉 神经 元 只 伸 出 一 条 纤维 ， 但 在 离开 细胞 体 不 远 处 分 为 两 支 。 一 支 到 感 
受 器 ， 称 为 周围 支 ， 另 一 支 进入 肴 苦 ， 称 为 中 枢 支 。 前 者 是 传 入 纤维 ， 将 来 自 感受 器 的 感 
觉 冲动 传 入 细胞 体 ， 所 以 从 功能 上 看 应 是 树 突 ， 但 却 有 轴 突 的 结构 ;后 者 从 功能 和 结构 上 
看 都 肯定 是 轴 突 。 

神经 元 具有 以 下 基本 功能 特性 

。 时 空 整合 功能 

。 神经 元 的 动态 极 化 性 ; 

。 兴奋 与 抑制 状态 

。 结构 的 可 塑性 

。 脉冲 与 电位 信号 的 转换 ， 

。 突 触 延期 和 不 延期 ; 

。 学 习 、 遗 忘 和 疲劳 。 

神经 网 络 是 由 大 量 的 神经 元 单元 互相 连接 而 构成 的 网 络 系统 。 但 是 ， 实 际 上 神经 网 络 
的 模型 只 是 生物 神经 网 络 的 抽象 、 简 化 和 模拟 ， 并 不 能 够 完全 反映 大 脑 的 功能 ， 而 神经 网 
络 模型 的 理念 正 是 受到 生物 神经 网 络 模型 的 研究 启发 而 产生 的 。 


6.2.2 ”神经 网 络 模型 


人 工 神经 网 络 ， 是 通过 模仿 动物 神经 网 络 行为 特征 ， 进 行 分 布 式 并 行 信息 处 理 的 算法 
数学 模型 。 这 种 网 络 依靠 系统 的 复杂 程度 ， 通 过 调整 内 部 大 量 节点 之 间 相 互 连 接 的 关系 
从 而 达到 处 理 信息 的 目的 。 

人 工 神经 网 络 具有 自学 习 和 自 适应 的 能 力 ， 可 以 通过 预先 提供 的 一 批 相互 对 应 的 输入 
输出 数据 ， 分 析 掌握 两 者 之 间 潜 在 的 规律 ， 最 终 根据 这 些 规律 ， 用 新 的 输入 数据 来 推算 输 
出 结果 ， 这 种 学 习 分 析 的 过 程 被 称 为 “训练 "。 

同 生物 神经 系统 类 似 ， 人 工 神经 网 络 也 是 由 人 工 神经 元 为 基本 单元 构成 的 。 人 工 神经 
元 是 模拟 生物 神经 元 的 数学 模型 ， 是 人 工 神经 网 络 的 基本 处 理 单元 ， 同 时 也 是 一 个 多 输入 / 
单 输出 的 非 线性 元 件 ， 如 图 6-2 所 示 。 
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图 6-2 简单 人 工 神经 元 模型 


神经 元 的 每 一 个 输入 连接 都 有 突 触 连 接 强度 ， 用 一 个 连接 权 值 来 表示 ， 即 将 产生 的 信 
号 通过 连接 强度 放大 ， 每 一 个 输入 量 ( xj ) 都 相应 有 一 个 相关 联 的 权重 { wy )。 处 理 单元 
将 经 过 权重 的 输入 量化 ， 然 后 相 加 求 得 其 加 权 值 之 和 ， 计 算出 唯一 的 输出 量 ， 这 个 输出 量 
( 》) 是 权重 和 的 函数 ， 一 般 称 此 函数 为 传递 函数 。 这 个 过 程 可 以 用 公式 表示 为 


y=J( 了 miz+ 间 
7 


其 中 /表示 此 神经 元 采用 的 传递 函数 。 

对 于 基本 的 感知 器 神经 元 ， 其 工作 方式 是 将 加 权 总 和 与 神经 元 的 阔 值 进行 比较 ， 若 它 
大 于 立 值 ， 神 经 元 被 激活 。 当 它 被 激活 时 ， 信 号 被 传送 到 与 其 相连 的 更 高 一 级 神经 元 。 此 
过 程 中 采用 的 传递 函数 为 硬 限 值 函数 。 

不 同类 型 的 神经 网 络 采用 的 传递 函数 各 有 不 同 ， 通 常 采用 的 函数 包括 : 硬 限 值 函 数 
( hardlim 人 线性 函数 ( purelin )、Sigmoid 函数 ( logsig )、 高 斯 径 向 基 函 数 ， 等 等 。 传 递 函 
数 的 不 同 也 导致 了 各 种 神经 网 络 在 结构 和 功能 上 的 差异 ， 如 图 6-3 所 示 。 











purelintm) 


图 6-3 ”常用 的 传递 函数 示意 


神经 网 络 由 排列 成 层 的 处 理 单元 组 成 ， 接 收 输入 信号 的 神经 元 层 称 输入 层 ， 输 出 信号 
的 神经 元 层 称 输出 层 ， 不 直接 与 输入 /输出 发 生 联系 的 神经 元 层 称 为 中 间 层 或 隐 层 。 

如 果 网 络 获得 一 组 输入 数据 ， 在 网 络 输入 层 的 每 个 神经 元 都 接收 到 输入 模式 的 一 部 
分 ， 然 后 输入 层 将 输入 通过 连接 传递 给 隐 层 。 隐 层 接收 到 整个 输入 模式 ， 由 于 传递 函数 的 
作用 ， 隐 层 单元 的 输出 就 与 输入 层 大 不 相同 。 

输出 单元 从 隐 层 单元 接收 输出 活动 的 全 部 模式 ， 但 隐 层 单元 往 输出 层 的 信号 传递 要 经 
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过 权重 的 连接 ， 所 以 输出 层 单 元 有 的 激发 ， 有 的 抑制 ， 从 而 产生 相应 的 输出 信号 。 输 出 层 
单元 输出 的 模式 就 是 网 络 对 输入 模式 激励 的 总 的 响应 。 
基本 的 神经 网 络 结构 如 图 6-4 所 示 。 








图 6-4 ”神经 网 络 结构 示意 


对 于 大 多 数 神经 网 络 ， 在 网 络 运行 的 时 候 ， 传 递 函数 一 旦 选 定 ， 就 保持 不 变 。 而 权重 
的 动态 修改 是 学 习 中 最 基本 的 过 程 ， 类 似 于 “智能 过 程 "。 可 见 ， 网 络 最 重要 的 信息 是 存 
储 于 调整 过 的 权重 之 中 。 


6.2.3 ”神经 网 络 的 训练 


当 神 经 网 络 的 模型 结构 确定 之 后 ， 接 下 来 就 是 学 习 和 训练 。 网 络 不 是 通过 修改 处 理 单 
元 本 身 来 完成 训练 过 程 ， 而 是 靠 改变 网 络 中 连接 的 权重 来 学 习 的 。 因 此 若 处 理 单元 要 学 会 
正确 地 反映 所 给 数据 的 模式 ， 唯 一 用 以 改变 处 理 单元 性 能 的 元 素 就 是 连接 的 权重 。 

应 该 指出 ， 训 练 和 学 习 并 不 完全 相同 ， 训 练 是 指 神经 网 络 的 学 习 过 程 ， 而 学 习 是 此 过 
程 的 结果 。 训 练 是 外 部 过 程 ， 而 学 习 是 神经 网 络 的 内 部 过 程 。 

由 于 神经 网 络 的 连接 模型 、 输 入 信息 的 离散 性 或 连续 性 、 有 无 监督 训练 、 神 经 元 的 动 
态 特 性 等 的 不 同 ， 响 应 的 学 习 算法 也 不 同 。 

(1 ) 有 监督 学 习 算法 。 要 求 同 时 给 出 输入 和 正确 的 输出 ， 网 络 根据 当前 输出 与 所 要 求 
的 目标 输出 差 来 进行 网 络 调整 ， 使 网 络 做 出 正确 的 反应 。 

( 2 ) 无 监督 学 习 算法 。 只 需 给 出 一 组 输入 ， 网 络 能 够 逐渐 演变 对 输入 的 某 种 模式 做 出 
特定 的 反应 。 即 训练 样本 中 只 有 输入 矢量 ， 神 经 网 络 靠 比较 各 输入 矢量 之 间 的 关系 来 调整 
权 值 ， 从 而 将 训练 样本 中 输入 矢量 之 间 的 关系 映射 到 网 络 的 权 值 上 ， 以 实现 联想 记忆 或 数 
据 压缩 的 功能 。 例 如 入 脑 采用 的 就 是 一 种 典型 的 无 监督 训练 。 由 于 这 类 网 络 没有 输出 矢量 ， 
所 以 不 能 用 于 模拟 函数 。 

神经 网 络 的 学 习 规则 对 应 着 各 种 不 同 的 调整 神经 元 之 间 权 重 的 策略 ， 包 括 如 下 方面 

。 学 习 规 则 

e 纠 错 学 习 规 则 ， 也 称 Widrow-Hoff 学 习 规 则 。 

。 基 于 记忆 的 学 习 规 则 
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。 随 机 学 习 规则 。 
。 竞争 学 习 规则 。 


6.2.4 ”神经 网 络 的 分 类 

神经 网 络 通常 按照 不 同 的 结构 、 功 能 ， 以 及 学 习 算 法 ， 对 网 络 进行 分 类 ， 可 以 分 为 ， 
1 感知 器 神经 网 络 

最 简单 的 神经 网 络 类 型 ， 只 有 单 层 的 神经 网 络 结 构 ， 采 用 硬 限 值 函数 作为 网 络 传递 函 
数 ， 适 用 于 简单 的 线性 二 类 划分 问题 。 
2 线性 神经 网 络 

单 层 结构 的 神经 网 络 ， 采 用 线性 函数 作为 网 络 传递 函数 ， 适 用 于 数据 的 线性 拟 合 与 副 
近 等 应 用 。 
3，BP 神经 网 络 


应 用 最 为 广泛 的 网 络 , 具有 多 层 的 网 络 结构 , 含有 一 个 或 更 多 的 隐 层 。 其 结构 如 图 6-5 
所 示 。 











上 虽 C 上 
2 





输入 展 j 隐居 
图 6-5 BP 网 络 结构 


BP 网 络 采用 Widrow-Hoff 学 习 算 法 和 非 线 性 传递 函数 , 典型 的 BP 网 络 采用 的 是 梯度 
下 降 算法 ， 也 就 是 Widrow-Hoff 算法 所 规定 的 。BP， 即 Back Propagation， 就 是 指 为 非 线 
性 多 层 网 络 训练 中 梯度 计算 时 采用 信号 正 向 传播 、 误 差 反 向 传播 的 方式 。 

对 于 BP 网 络 的 训练 ， 现 在 有 许多 基本 的 优化 算法 ， 例 如 变 尺 度 算法 和 牛顿 算法 。 
MATLAB 神经 网 络 工具 箱 提 供 了 许多 这 样 的 算法 。 

通过 采用 非 线性 传递 函数 ，BP 网 络 能 够 以 任意 的 精度 禹 近 任何 非 线性 函数 ， 这 是 一 
项 非常 重要 的 性 能 。 由 于 采用 隐 层 中 间 层 结构 ，BP 网 络 能 够 提取 出 更 高 阶 的 统计 性 质 ， 
尤其 是 当 输入 规模 庞大 时 ， 网 络 能 够 提取 高 阶 统计 性 质 的 能 力 就 显得 非常 重要 。 


4 径 向 基 神 经 网 络 

径 向 基 神 经 网 络 又 称 为 RBF 网 络 ， 它 与 BP 网 络 同 为 多 层 前 向 网 络 ， 也 能 够 以 任意 的 
精度 各 近 任何 非 线性 函数 。 只 是 两 者 采用 的 传递 函数 不 同 。BP 网 络 通常 采用 Sigmoid 函数 
或 线性 函数 作为 传递 函数 ， 而 RBF 网 络 则 采用 径 向 基 函 数 作为 传递 函数 。 
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由 于 采用 了 径 向 基 传 递 函数 ，RBF 网 络 具有 比 BP 网 络 更 高 的 训练 速度 ， 避 免 了 误差 
反 向 传播 过 程 中 烦琐 的 计算 ， 更 适用 于 新 数据 ， 收 全 性 也 相对 较 好 。 
5 竞争 神经 网 络 

竞争 神经 网 络 的 特点 是 它 的 各 个 神经 元 之 间 是 相互 竞争 的 关系 ， 众 多 神经 元 之 间 相 互 
竞争 以 决定 出 胜 者 ， 获 胜 神经 元 决定 哪 一 种 原型 模式 最 能 够 代表 输入 模式 。 因 此 竞争 神经 
网 络 非常 适应 于 模式 分 类 的 问题 。 

常见 的 竞争 神经 网 络 包括 自 组 织 映射 网 络 、 学 习 矢量 量化 网 络 ， 等 等 。 


6. 反馈 神经 网 络 〈Hopfield 神经 网 络 ) 

反馈 神经 网 络 是 一 种 反馈 动力 学 系统 。 在 这 种 网 络 中 ， 每 个 神经 元 同时 将 自身 的 输出 
信号 作为 输入 信号 反馈 给 其 他 神经 元 ， 它 需要 工作 一 段 时 间 才 能 达到 稳定 。Hopfield 神经 
网 络 是 反馈 网 络 中 最 简单 且 应 用 广泛 的 模型 ， 它 具有 联想 记忆 的 功能 ， 如 果 将 李 雅 普 诺 夫 
函数 定义 为 寻 优 函 数 ，Hopfield 神经 网 络 还 可 以 用 来 解决 快速 寻 优 问题 。 其 结构 如 图 6-6 
所 示 。 





























图 6-6 ”反馈 神经 网 络 结构 


7. 随机 神经 网 络 

随机 神经 网 络 是 在 神经 网 络 中 引入 了 随机 机 制 而 产生 的 ， 一 个 经 典 的 范例 是 采用 基于 
统计 物理 的 模拟 退火 算法 进行 训练 的 Boltzmann 随机 网 络 模型 。 在 随机 神经 网 络 中 ， 神 经 
元 按照 概率 原理 工作 ， 网 络 也 依照 概率 取得 不 同 的 网 络 状态 。 

随机 神经 网 络 常用 来 解决 组 合 优化 的 问题 。 


神经 网 络 的 应 用 
神经 网 络 的 发 展 已 经 有 50 年 的 历史 了 ， 但 是 实际 的 应 用 却 是 在 最 近 15 年 , 如 今 神 经 


网 络 仍 快速 发 展 着 ， 其 应 用 的 种 类 已 经 涵盖 到 各 行 各 业 方 方面 面 ， 下 面 列举 几 个 神经 网 络 
的 应 用 方向 对 其 进行 说 明 。 
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1. 工业 控制 应 用 

基于 人 工 神经 网 络 的 控制 ( ANN-based Control ) 简称 神经 控制 ( Neural Control )。 利 
用 神经 网 络 强大 的 自 适应 性 和 学 习 能 力 、 非 线性 映射 能 力 、 鲁 棒 性 和 容错 能 力 ， 充 分 地 将 
这 些 神经 网 络 特性 应 用 于 控制 领域 ， 可 使 控制 系统 的 智能 化 向 前 迈进 一 大 步 。 

随 着 被 控 系统 越 来 越 复杂 ， 人 们 对 控制 系统 的 要 求 越 来 越 高 ， 特 别 是 要 求 控制 系统 能 
适应 不 确定 性 、 时 变 的 对 象 与 环境 。 传 统 的 基于 精确 模型 的 控制 方法 难以 适应 要 求 ， 现 在 
关于 控制 的 概念 也 已 更 加 广泛 ， 它 要 求 包括 一 些 决策 、 规 划 以 及 学 习 功 能 。 神 经 网 络 由 于 
具有 上 述 优点 而 越 来 越 受到 人 们 的 重视 。 


2 医学 应 用 

随 着 神经 网 络 新 的 理论 、 技 术 、 方 法 的 不 断 涌现 ， 其 模仿 人 的 智能 的 程度 不 断 提升 ， 
已 经 得 到 很 多 商业 化 的 应 用 。 在 医学 上 ， 手 术 期 和 重症 监护 与 治疗 阶段 ， 需 要 获取 大 量 的 
信息 ， 既 有 纯 数 据 、 又 有 生物 信号 、 图 像 、 文 字 等 ， 既 有 数字 化 确定 的 信息 ， 又 有 不 确定 
和 模糊 的 表述 ， 既 有 静态 的 ， 又 有 动态 的 ， 既 有 共性 的 征象 ， 又 有 个 体 差 异 ， 客 观 上 为 新 
技术 的 应 用 提供 了 广阔 的 舞台 。 

在 信号 处 理 、 基 于 动态 数据 驱动 的 辅助 决策 专家 系统 、 数 据 控 气 、 各 种 临床 状况 的 预 
测 、 智 能 化 床 旁 监护 、 远 程 医疗 与 教学 、 医 疗 机 器 人 等 各 方面 运用 神经 网 络 技术 和 其 他 人 
工 智能 技术 ， 帮 助 忙碌 的 医护 人 员 更 有 效 、 安 全 、 经 济 地 为 病人 服务 。 


3. 图 像 处 理 

神经 网 络 所 具有 的 自学 习 ， 自 适应 和 强大 的 信息 综合 能 力 ， 决 定 了 它 可 以 很 好 地 模拟 
人 眼 的 功能 ， 完 成 普通 的 边缘 算 子 难以 完成 的 边缘 检测 。 同 时 ， 神 经 网 络 边 缘 检 测算 法 通 
过 训练 可 以 识别 噪声 与 边缘 图 像 的 差异 ， 从 而 去 除 噪 声 引起 的 虚假 边缘 ， 具 有 很 好 的 抗 噪 
性 。 

运用 神经 网 络 进行 数字 图 像 的 边缘 检测 成 为 近年 来 的 研究 热点 ， 涌 现 出 大 量 的 理论 和 
方法 ， 所 用 算法 几乎 涵盖 了 各 种 类 型 的 神经 网 络 。 相 信 随 着 神经 网 络 技术 的 不 断 革新 ， 运 
用 神经 网 络 技术 的 图 像 处 理 技术 必然 也 会 得 到 迅速 的 发 展 。 


4.， 经济 金 融 

自 20 世纪 80 年 代 示 至今， 人工 智 能 得 到 了 很 大 的 发 展 ， 特 别 是 神经 网 络 的 研究 取得 
了 划时代 的 发 展 。 在 经 济 金融 领域 ， 主 要 是 应 用 神经 网 络 方法 进行 投资 预测 ， 这 是 近年 来 
的 研究 热点 。 

从 1988 年 开始 ， 人 们 利用 BP 网 络 对 IBM 股票 进行 预测 ， 其 目标 是 未 来 一 个 月 内 买 
进 和 卖 出 的 最 佳 时 机 ;从 此 以 后 ， 人 们 利用 神经 网 络 对 世界 各 大 股票 市 场 的 价格 走势 、 各 
种 证 券 指 数 的 变动 、 投 资 组 合 决策 进行 了 长 短期 的 预测 。 神 经 网 络 的 模式 识别 、 自 适应 逼 
近 ， 以 及 适应 于 非 线性 的 能 力 获得 了 充分 的 应 用 。 
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神经 网 络 工具 箱 简介 


6.4.1 工具 箱 的 功能 


神经 网 络 工具 箱 扩充 了 MATLAB 在 设计 、 应 用 、 显示 和 仿真 神经 网 络 上 的 功能 ， 可 
以 将 其 用 来 解决 常规 难以 解决 的 问题 ， 并 且 可 应 用 于 各 个 领域 ， 以 实现 各 种 复杂 的 功能 。 

神经 网 络 工具 箱 由 神经 网 络 数 据 对 象 ， 各 种 类 型 的 神经 网 络 创建 函数 、 传递 函数 、 学 
习 规则 、 图 形 用 户 界面 、Simulink 工具 函数 等 组 成 。 因为 神经 网 络 需 要 复杂 的 矩阵 计算 ， 
MATLAB 提供 了 一 个 神经 网 络 数据 结构 ， 使 得 用 户 可 以 快速 地 学 习 和 应 用 神经 网 络 。 

此 外 ， 神经 网 络 工具 箱 还 提供 了 方便 用 户 设计 和 管理 网 络 的 图 形 用 户 界面 (GUI)， 以 
及 大 量 已 经 被 证 实 的 标准 、 开 放 、 可 扩展 的 设计 实例 。 图 形 界面 工具 使 得 使 用 神经 网 络 变 
得 简单 。 它 能 够 导入 大 量 复 杂 的 数据 ， 并 能 够 很 快 地 产生 、 初 始 化 、 训练 、 仿 真 和 管理 网 
络 。 其 中 简单 的 图 像 表 示 有 助 于 明确 和 理解 网 络 的 结构 。 

神经 网 络 工具 箱 中 包含 了 许多 示例 ， 每 一 个 示例 讲述 一 个 问题 。 示例 中 展示 了 用 来 解 
决 问题 的 网 络 ， 并 给 出 最 后 的 结果 。 

神经 网 络 工具 箱包 含 在 nnet 目录 中 ， 在 MATLAB 命令 行 中 输入 “help nnet” 可 得 到 
神经 网 络 工具 箱 的 帮助 主题 

MATLAB 神经 网 络 工具 箱 提供 了 多 种 类 型 的 神经 网 络 模型 ， 包括 感知 器 网 络 、 线 性 神 
经 网 络 、BP 神经 网 络 、 径 向 基 神 经 网 络 、 反 馈 神经 网 络 、 自 组 织 神经 网 络 和 学 习 矢量 量 
化 神经 网 络 ， 等 等 ， 这 些 内 容 将 在 本 书 的 后 续 章节 中 进行 详细 介绍 。 

这 些 神经 网 络 模型 可 以 应 用 于 多 个 方面 ， 主 要 包括 

(1 ) 函数 拟 合 与 逼近 。 

( 2 ) 模式 识别 、 图 像 处 理 。 

( 3 ) 信息 处 理 、 时 间 序 列 预 测 。 

(4 ) 工业 控制 与 故障 诊断 。 

在 实际 应 用 中 ,首先 需 要 根据 问题 的 实际 情况 ， 对 问题 进行 定义 ， 同 时 确定 输入 /输出 
样本 集 ; 然后 选择 合适 的 网 络 模型 ， 通过 训练 样本 完成 网 络 训练 ， 使 之 适用 于 该 实际 问题 
的 解决 ， 从 而 实现 模式 分 类 、 数 据 预测 、 函 数 拟 合 等 功能 ; 最 后 选择 合理 的 测试 样本 ， 对 
训练 后 的 网 络 进行 仿真 ， 检 验 网 络 的 性 能 。 

利用 MATLAB 神经 网 络 工具 箱 ， 可 以 轻松 地 完成 很 多 需要 复杂 烦琐 的 操作 才能 够 完 
成 的 工作 ， 有 利于 提高 效率 ， 减 轻 工 作 和 研究 人 员 的 负担 。 


6.4.2 “工具 箱 的 新 特性 


MATLAB R2008b 中 的 神经 网 络 工具 箱 版 本 号 为 Version 6.0.1， 其 内 容 与 MATLAB 
R2008a 中 的 神经 网 络 工具 箱 6.0 版 本 基本 一 致 相对 于 此 前 的 工具 箱 版 本 ，6.0 及 其 之 后 
的 版 本 又 增加 了 一 些 新 的 特性 。 主 要 的 新 特性 和 改动 包括 : 
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1 新 的 具有 动画 绘图 功能 的 GUI 训练 工具 

目前 可 以 自动 地 在 窗口 中 打开 利用 训练 函数 对 网 络 进行 训练 的 功能 ， 此 窗口 将 会 显示 
网 络 结构 框图 、 训 练 算法 名 称 ， 以 及 训练 状态 信息 。 

此 外 ， 此 窗口 中 同时 包含 了 几 个 与 被 训练 网 络 相关 的 按钮 ， 通 过 这 些 按钮 可 以 在 训练 
中 或 训练 后 启动 绘图 程序 。 如 果 在 训练 过 程 中 启动 绘图 ， 则 绘图 会 随 训练 进度 逐步 更 新 ， 
从 而 以 动画 的 方式 显示 网 络 误差 性 能 在 训练 过 程 中 的 变化 。 

应 用 下 面 的 命令 可 以 打开 和 关闭 上 述 训练 窗口 : 

enntraintool 

e nntraintool(close) 

与 绝 大 多 数 网络 训 练 相关 的 绘图 函数 如 下 。 

。 plotperform， 绘 制 误差 性 能 。 

eplottrainstate， 绘制 训练 状态 。 


2 新 的 模式 识别 网 络 、 绘 图 和 分 析 GUI 工具 

利用 函数 nprtool 可 以 打开 一 个 GUI 界面 ， 此 界面 将 引导 用 户 解决 模式 识别 问题 。 用 
户 可 以 在 此 界面 定义 自己 的 问题 ， 或 者 选择 使 用 任意 提供 的 数据 集 。 

应 用 newpr 函数 可 以 以 命令 行 的 方式 生成 一 个 模式 识别 网 络 。 这 实际 是 一 种 前 向 型 
BP 网 络 ， 适 用 于 2 选 1 或 选 1 的 问题 的 求解 。 


3， 新 的 聚 类 训练 、 初 始 化 以 及 绘图 GUI 工具 

利用 nctool 函数 可 以 打开 一 个 GUI 界面 , 此 界面 可 以 引导 用 户 生成 用 于 解决 聚 类 问题 
的 自 组 织 映射 网 络 。 用 户 可 以 定义 自己 的 问题 ， 也 可 以 使 用 提供 的 数据 集 。 

应 用 initsompc 函数 可 以 初始 化 自 组 织 映射 层 的 权 值 ， 以 便 加 速 训练 过 程 。 应 用 
learnsomb 函数 可 以 实现 对 SOM 网 络 的 批 处 理 训练 , 其 训练 速度 比 逐 步 训练 有 数量 级 上 的 
提升 。 应 用 newsom 函数 可 以 应 用 快速 算法 创建 一 个 SOM 网 络 。 

此 外 ， 与 自 组织 映 射 网 络 相关 的 新 的 绘图 函数 还 包括 如 下 命令 。 

。plotsomhits: 绘制 自 组 织 映射 输入 样本 命中 。 

eplotsomnc: 绘制 自 组 织 映 射 邻 元 连接 。 

eplotsomnd:， 绘制 自 组 织 映射 邻 元 距离 。 

。 plotsomplanes:， 绘制 自 组 织 映射 输入 权 值 平面 。 

。 plotsompos: 绘制 自 组 织 映射 权 值 位 置 。 

。plotsompos: 绘制 自 组 织 映射 拓扑 。 


4 新 的 网 络 结 构 查看 器 与 改进 的 结构 框图 

新 的 神经 网 络 结构 框图 支持 绝对 连接 网 络 ， 同 时 具有 更 好 的 外 观 ， 通 过 色彩 和 阴影 对 
视觉 效果 进行 改进 。 网 络 结构 框图 出 现在 所 有 的 神经 网 络 图 形 界 面 工具 中 。 此 外 ， 通 过 命 
仿 行 方式 也 可 以 查看 任意 神经 网 络 的 结构 。 使 用 的 命令 如 下 


View(new) 
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5， 新 的 拟 合 网 络 ， 绘 图 和 更 新 的 拟 合 GUI 工具 


应 用 newfit 函数 可 以 创建 一 个 包含 前 向 BP 网 络 以 及 拟 合 绘图 工具 的 拟 合 网 络 。 神 经 
网 络 工具 箱 也 考虑 了 对 以 往 版 本 的 兼容 性 问题 ， 尽 管 nftool 生成 的 代码 与 以 往 版 本 不 同 ， 
但 在 以 往 版 本 中 编写 的 程序 仍然 能 够 在 新 的 版 本 中 正常 运行 。 


6.4.3 “MATLAB 中 的 神经 网 络 数据 结构 


MATLAB 神经 网 络 工具 箱 中 ,所 创建 的 神经 网 络 都 通过 一 个 经 过 定义 的 网 络 对 象 数据 


结构 来 表征 。 通 过 MATLAB 提供 的 各 种 网 络 创建 函数 命令 即 可 生成 网 络 对 象 ， 同时 也 可 
以 查看 其 数据 结构 的 内 容 。 


例如 ， 输 入 如 下 简单 的 命令 ， 就 可 以 创建 一 个 网 络 对 象 : 
p=[0101;0011]， 


t=[1 10 0]， 
met -= newtf(minmax(p)，[2，1]，{，1logsig'，， purelin')，” trainlm')， 
从 输出 的 语句 中 我 们 可 以 看 到 其 基本 的 网 络 对 象 属性 ， 此 对 象 数据 结构 定义 如 下 
net = 

Neural Network object: 

architecture: 


numInputs: 1 
numLayers: 1 
biasConnect: [1] 
inputConnect: [11] 
layerConnect: [0] 
outputconnect: [1] 
numoutputs: 1 (reaG-only) 
numIhputDelays: 0 (read-only) 
numLayerDelays: 0 (read-only) 
Bubobject atructurea: 
inputs: {1xl cel1} of inputs 
layers: {1xl cell}) of layers 
outputs: {1x1 cell) containing 1 output 
biases: {1xl1 cell) containing 1 bias 
inputWeights: {1xl cell) containing 1 input weight 
layerWeights: {1x1 cell) containing no layer weights 
functions: 
adaptFcn: 'trains' 
divideFcn: (none) 
gradientFcn: 'calcgrad' 
initFcn: 'initlay" 
performFcn: "mae' 






plotFcns: {'Plotperform'， “plottrainscate'】} 
trainFcn: 'Erainc' 
Dparameters: 
adaptParam: .passes 
divideParam: (none) 
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gradientParam: (none) 
initParam: (none) 
performParam: (none) 
trainParam: .show，.showWindow，.showCommandLine，.epochs， 
.goal，.cime 
weight and bias values: 
IW: {lxl cel1) containing 1 input weight matrix 
LNW: {lxl cel1} containing no layer weight matrices 
b: {1x1 cel1) containing 1 bias vector 
other: 


name: 
userdata: (user information) 


上 面 给 出 了 网 络 对 象 包 含 的 属性 ， 其 中 各 组 属性 分 别 介绍 如 下 。 

1， 网 络 结构 属性 ( architecture )。 

(1 ) numInputs， 网 络 输入 数目 。 

(2 ) numLayers， 网 络 的 层 数 。 

( 3 ) biasConnect: 网 络 偏差 连接 属性 。 

( 4 ) inputConnect， 输入 连接 属性 。 

( 5 ) layerConnect: 层 连 接 属 性 。 

(6 ) outputConnect， 输 出 连接 属性 。 

(7 ) numOutputs， 输出 向 量 数目 。 

(8 ) numInputDelays， 输入 延迟 属性 。 

( 9 ) numLayerDelays， 层 延迟 属性 。 

需要 指出 的 是 ， 参 数 中 网 络 输入 数目 与 网 络 输入 向 量 大 小 是 不 一 样 的 。 前 者 由 参数 
numInputs 决定 ， 而 后 者 由 参数 netinputs{ij.size 决定 。 

2， 子 对 象 属性 ( subobject stmctures )。 所 谓 子 对象 属 性 ， 是 指定 义 网 络 输入 、 层 、 输 
出 、 目 标 、 权 值 阔 值 向 量 等 的 元 胞 矩阵 。 

(1 ) inputs， 输 入 向 量 。 

(2 ) layers:， 网 络 层 。 

(3 ) outputs， 输 出 向 量 。 

(4 ) biases， 偏 差 向 量 。 

(5 ) inputWeights， 输 入 权 值 。 

(6 ) layerWeights， 层 权 值 。 

3.， 网络 函 数 ( functions )o 

(1 ) adaptFcn: 自 适应 训练 函数 。 

( 2 ) devideFcn: 网 络 训练 过 程 中 选用 的 数据 划分 函数 。 

(3 ) gradientFcn: 梯度 函数 。 

{ 4 ) initFcn， 初始 化 函数 。 

( 5 ) performFcn， 误差 性 能 函数 。 
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(6 ) plotFcns: 绘图 函数 。 

{ 7 ) trainFcn: 训练 函数 。 

4， 网 络 参 数 ( parameters )。 

{ 1 ) adaptParam: 自 适 应 训练 函数 参数 。 

(2 ) divideParam:， 数据 分 组 参数 。 

(3 ) gradientParam:， 梯度 函数 参数 。 

(4) initParam:， 初始 化 函数 参数 。 

( 5 ) performParam:， 误差 性 能 函数 参数 。 

(6 ) trainParam: 训练 函数 参数 。 

5， 权 值 和 偏差 值 ( weight and bias values )， 即 权 值 和 偏差 矩阵 的 值 。 

(1) ITW: 输入 权 值 和 矩阵。 

(2 ) LW:， 层 权 值 短 阵 。 

( 3 ) b， 偏差 矩阵 。 

6 其 他 属性 。 

netuserdata， 用 户 增加 的 自 定义 信息 

需要 指出 的 是 ， 以 上 列 出 的 许多 网 络 属性 之 间 会 相互 影响 ， 改 变 其 中 的 一 个 值 ， 其 他 
与 之 相关 的 参数 随 之 变动 ， 例 如 对 网 络 输入 数目 numInputs 的 改动 同时 会 引起 输入 连接 属 
性 inputConnect 参数 和 子 对象 参 数 neLinputs 的 变化 ; 对 netbiasConnect 参数 的 改动 会 引起 
其 他 参数 如 netbiases 以 及 netb 的 变动 。 


6.4.4 ”工具 箱 函数 简 介 


MATLAB 神经 网 络 工具 箱 为 用 户 提供 的 函数 大 体 可 分 为 两 类 : 第 一 类 是 通用 函数 , 大 
体 上 对 所 有 网 络 都 能 够 应 用 ， 例 如 神经 网 络 的 初始 化 函数 、 仿 真 函数 ， 以 及 训练 函数 等 ; 
第 二 类 则 是 某 一 类 型 的 神经 网 络 专用 的 ， 例 如 各 种 类 型 网 络 的 创建 函数 等 。 

这 些 函数 将 设计 网 络 过 程 中 的 复杂 的 计算 进行 了 封装 ， 这 使 得 设计 者 可 以 从 网 络 设计 
的 繁重 工作 中 跳出 来 ， 专 注 于 问题 的 解决 方法 的 思考 。 表 6-1 列 出 了 主要 的 工具 箱 函数 及 
其 说 明 ， 函 数 的 具体 应 用 将 在 后 续 章节 中 介绍 。 





表 6-1 神经 网 络 工具 箱 常用 函数 列表 
通用 函数 






































in 训练 函数 hardlims 对 称 硬 限 值 函数 
ainb 权 值 阔 值 训练 函数 init | 网络 初 好 化 
adapt 自 适应 训练 函数 initay 多 层 网 络 初始 化 
leamp 网 络 学 习 函数 inimw 用 NW 规则 初始 化 
ieampn 标准 学 习 函数 initwb 对 指定 层 初始 化 
| sm 神经 网 络 仿真 函数 etsum 对 输入 求 和 
| manm 看 限 值 了 数 ctprod 对 输入 求 积 丑 
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续 表 
专用 函数 
新 建 感知 器 网 络 plotpy 绘制 感知 器 目标 向 量 
新 建 线性 网 络 plotpc 绽 制 感知 器 决策 分 界线 
设计 一 个 线性 网 络 earnwh Widrow-Hoff 学 习 函 数 
新 建 前 俩 网 络 maxlinlr 计算 最 大 线性 学 习 速 率 
新 建 延 迟 前 局 网 络 logsig S 对 数 传递 函数 
新 建 层 回 钙 网 络 dlogsig logsig 导数 函数 
新 建 Hopfield 网 络 tansig S 正切 传递 函数 
新 建 RBF 网 络 dansig tansig 导数 函数 
新 建 一 个 严格 的 RBF 网 络 purelin 线性 函数 
mewpnn 新 建 概率 神经 网 络 梯度 下 降 学 习 函 数 
newgmn 新 建 广义 回归 网 络 带动 量 梯度 下 降 学 习 函 数 
newc 新 建 竞争 层 径 向 基 传递 函数 
newsom 新 建 自 组 织 映 射 网 络 竞争 传递 函数 











newlvq 新 建 学 习 矢量 量化 网 络 软 最 大 传递 函数 
在 表 6-1 中 ， 通 用 函数 主要 是 网 络 训练 、 初 始 化 、 仿 真 等 函数 ， 专 用 函数 则 主要 是 各 
种 网 络 创建 函数 、 网 络 传递 函数 、 训 练 算法 函数 等 。 对 于 它们 的 具体 调用 格式 和 应 用 实例 ， 
将 在 后 续 的 章节 中 根据 内 容 进 行 详细 介绍 。 


小 结 


MATLAB 神经 网 络 工具 箱 充 分 利用 了 计算 机 所 提供 的 软 硬 件 资源 和 先进 思想 ,功能 全 
面 、 应 用 便捷 ， 是 一 个 非常 优秀 的 神经 网 络 工具 软件 包 ， 在 国外 ， 它 已 经 得 到 了 很 好 的 推 
广 和 应 用 。 精 通 MATLAB 神经 网 络 工具 箱 的 使 用 ， 将 使 得 设计 者 如 虎 添 现 ， 腾 出 更 多 时 
间 思 考 和 研究 出 功能 更 强 、 更 加 有 效 的 神经 网 络 和 应 用 成 果 。 
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为 方便 用 户 更 直观 更 容易 地 应 用 神经 网 络 进行 数据 分 析 , MATLAB 提供 了 神经 网 络 图 
形 用 户 界面 ( Neural Network Graphic User Interface ) 的 功能 ， 该 图 形 界面 软件 是 神经 网 络 
工具 上 的 一 个 补充 ， 具 有 简洁 、 友 好 的 用 户 接口 ， 可 以 方便 地 应 用 于 实际 的 数据 分 析 ， 主 
要 适用 于 函数 拟 合 、 模 式 识 别 、 数 据 聚 类 这 几 个 主要 方面 。 


基础 GUI 工具 nntool 


要 应 用 神经 网 络 图 形 用 户 界面 工具 ， 首 先 需要 在 MATLAB 中 应 用 nntool 命令 调 出 
NetworkyData 管理 器 窗口 ， 此 窗口 具有 自己 的 工作 区 ， 是 与 MATLAB 自身 的 命令 行 工作 
区 分 开 的 。 因 此 , 使 用 GUI 的 时 候 , 需要 通过 操作 将 GUI 的 结果 导出 到 MATLAB 工作 区 。 
同时 ， 也 可 能 需要 将 MATLAB 工作 区 的 执行 结果 导入 到 GUI 中 。 

当 打开 Network/Data 管理 器 窗口 之 后 ， 就 可 以 利用 它 创 建 、 查 看 、 训练 神经 网 络 ， 当 
然 也 可 以 进行 仿真 和 数据 处 理 ， 然 后 将 处 理 得 到 的 结果 导出 到 MATLAB 工作 区 中 。 

本 章 我 们 将 以 实例 的 形式 ,讲解 如 何 利用 神经 网 络 GUI 生成 一 个 感知 器 神经 网 络 ， 并 
进行 数据 处 理 ， 与 MATLAB 工作 区 进行 数据 导入 导出 的 交互 过 程 。 主要 内 容 包括 ; 

。 创建 网 络 。 

。 训练 网 络 。 

。 网 络 仿真 。 

。 数据 导出 。 

。 数据 清除 。 

。 数据 导入 。 

。 数据 保存 与 读 取 。 

下 面 各 节 利用 GUI 创建 一 个 具有 届 辑 与 功能 的 感知 器 神经 网 络 ， 并 进行 训练 和 仿真 。 


7.1.1 网络 创建 


本 节 介 绍 如 何 利用 GUI 创建 所 需要 的 神经 网 络 。 


【 例 7-1】 利用 GUI 以 及 期 望 输入 p= [00110101， 期 望 响应 4=[000 1]， 创 建 一 
个 具有 逻辑 与 功能 的 感知 器 神经 网 络 。 
解 ，@@ 首先 启动 GUI， 在 MATLAB 工作 区 输入 命令 : 


mntool 
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此 命令 打开 Network/Data 管理 器 窗口 ， 其 界面 如 图 7-1 所 示 。 
II-asgsgessasseesseeassseess 
Fn Per 癌 | 





Se 二 | 昌 二 | -理惠 二 | em 
图 7-1 NetworkData 管理 器 窗口 








从 图 中 可 见 ，Network/Data 管理 器 窗口 分 为 7 个 区 域 ， 包 含 7 个 按钮 。 

(1) “Input Data” 区 域 : 用 于 显示 用 户 指定 的 输入 向 量 。 

(2 ) "Target Data” 区 域 : 用 于 显示 用 户 指定 的 期 望 目标 响应 。 

( 3 ) “Input Delay States” 区 域 ， 用 于 显示 设置 的 输入 延迟 情况 。 

(4) "Networks” 区 域 : 用 于 显示 操作 中 网 络 的 设置 。 

(5) "Output Data” 区 域 : 用 于 显示 网 络 的 仿真 输出 。 

(6 ) "Error Data” 区 域 : 用 于 显示 网 络 的 学 习 误差 。 

(7) “Layer Delay States” 区 域 ， 用 于 显示 网 络 各 层 的 延迟 状态 。 

操作 按钮 的 名 称 与 功能 分 别 如 下 。 

(1 ) "Import” 按 钮 : 从 MATLAB 工作 区 或 磁盘 导入 数据 。 

(2) "New” 按 钮 : 生成 新 的 网 络 或 数据 。 

(3 ) "Open” 按 钮 ， 打开 网 络 或 数据 ， 实 现 查看 、 编 辑 、 训 练 、 仿 真 等 操作 。 

(4) "Export” 按 钮 : 将 GUI 数据 导出 到 MATLAB 工作 区 或 磁盘 中 。 

(5) "Delete” 按 钮 : 删除 选择 的 数据 或 网 络 。 

(6) "Help” 按 钮 : 获取 GUI 帮助 。 

(7) “Close” 按 钮 : 关闭 GUI 窗口 。 

如 果 用 户 对 GUI 窗口 不 太 熟 悉 ， 可 以 单 击 “Help” 按 钮 。 此 时 将 弹出 帮助 窗口 ， 为 用 
户 介绍 GUI 的 使 用 步骤 ， 以 及 上 述 区 域 和 按钮 的 功能 。 

对 于 本 例 ， 首 先 需要 指定 创建 网 络 的 两 维 输入 向 量 。 单 击 “New” 按 钮 ， 将 弹出 一 个 
Create Network or Data 窗口 ， 生 成 这 些 需要 的 数据 。 

此 窗口 包含 两 个 选项 卡 ， 定 义 和 功 能 如 下 : 

(1) "Network” 选 项 卡 ， 用 于 定义 新 的 网 络 对 象 。 
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(2 ) “Data” 选 项 卡 ， 用 于 定义 新 的 数据 。 
单 击 “Data” 选 项 卡 ， 其 界面 如 图 7-2 所 示 。 





eet oo 








图 7-2 “Create Network or Data” 窗 口 -“Data” 选 项 卡 


从 图 中 可 以 看 到 ， 该 选项 卡 包含 如 下 两 个 区 域 。 

(1) “Name” 区域， 用 于 定义 新 数据 名 。 

(2 ) "Value” 区 域 ， 用 于 给 数据 赋值 。 

选项 卡 的 右 部 是 “Data Type" 单 选 按钮 区 ， 利 用 这 些 单 选 按钮 可 以 定义 不 同 的 数据 类 
型 。 

(1) Inputs， 输 入 向 量 。 

(2 ) Targets， 期 望 响 应 向 量 。 

(3 ) Input Delay States， 输 入 延迟 状态 向 量 。 

(4 ) Layer Delay States; 层 延 迟 状态 向 量 。 

(5 ) Output: 输出 向 量 。 

(6 ) Errors， 误 差 向 量 。 

在 此 选项 卡 中 , 将 “Name" 区 域 的 值 设 定 为 “p”, 将 Value 的 值 设 定 为 001 1010 1， 
并 将 “Data Type” 设 定 为 “Inputs"。 

单 击 “Create” 按钮 ， 在 弹出 的 对 话 框 中 单 击 “OK” 按钮 ， 就 创建 了 一 个 输入 向 量 忆 ， 
重新 弹出 Network/Data 管理 器 窗口 ， 在 “Input Data” 区 域 中 ， 将 咏 显 示 为 输入 向 量 ， 如 
图 7-3 所 示 。 

此 时 如 果 需 要 删除 该 向 量 ， 只 需 在 窗口 中 选中 “p"， 然 后 单 击 “Delete” 按 钮 ， 就 可 
以 删除 该 向 量 。 如 果 想 要 编辑 该 向 量 ， 可 以 选中 “p”， 双 击 ， 此 时 会 弹出 数据 编辑 窗口 ， 
如 图 7-4 所 示 ， 在 此 窗口 中 ， 可 以 更 改 向 量 忆 的 值 。 
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图 7-3 ”创建 输入 “p” 后 的 Network/Data 管理 器 窗口 图 7-4 向 量 吕 的 编辑 窗口 


以 同样 的 方法 定义 网 络 期 望 的 输出 响应 ， 在 “Create Network or Data" 窗 口中， 设置 
“Name” 为 “f"， "Value” 区 域 的 值 为 [0 0 0 1]， 并 选择 “Target” 作 为 "Data Type"， 单 击 
“Create” 和 “OK” 按 钮 ， 就 可 以 完成 期 望 输出 响应 : 的 定义 。 

完成 输入 与 期 望 响应 向 量 定义 后 的 Network/Data 管理 器 窗口 如 图 7-5 所 示 。 











| | | 
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图 7-5 “创建 输入 与 期 望 响应 后 的 Network/Data 管理 器 窗口 


名 利用 图 形 用 户 界 面 创建 该 感知 器 网 络 。 此 神经 网 络 名 称 定 为 ANDNet， 在 
Network/Data 管理 器 窗口 中 单 击 “New” 按 钮 ， 选 择 “Network” 选 项 卡 ， 该 选项 卡 界面 如 
7-6 所 示 。 

7-6 中 ， 默 认 的 网 络 类 型 为 BP 网 络 ， 选 项 卡 中 的 区 域 和 功能 如 下 。 

(1) "Name” 区 域 : 定义 网 络 名 称 。 

(2) “Network Type” 区 域 : 定义 网 络 类 型 。 

{ 3 ) 网 络 设置 区 域 : 可 以 对 网 络 输入 ( Input data )、 目 标 响应 ( Target data )、 训 练 函 
数 ( Training function 和 网 络 学 习 函 数 ( Adaption learming function )， 误 差 性 能 ( Performance 
function ) 函数 和 网 络 层 数 ( Number of layers ) 进行 设置 。 
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图 7-6 “Create Network or Data” 窗 口 -“Network” 选 项 卡 


(4 ) 层 属性 设置 区 域 . 对 指定 的 某 一 层 属性 进行 设置 。 

在 本 例 中 设置 网 络 名 称 为 “ANDNet ， _ 园 择 网 络 类 型 为 “Perceptron ， 则 窗口 更 换 到 
“Network" 选项 卡 。 将 网 络 输入 指定 为 “p"， 将 网 络 输出 指定 为 “f"，， 感 知 器 采用 硬 限 值 
函数 作为 传递 函数 ， 因此 将 网 结 传 迎 函数 vanafer Function” 选 项 指定 为 “HARLIM"。 
学 习 函 数 “Learning function” 选 项 设置 为 “LEARNP"。 

设置 完 后 的 Network 选项 卡 窗口 如 图 7-7 所 示 。 如 果 想 查看 此 网 络 ， 可 以 单 击 “View” 
按钮 ， 弹 出 的 窗口 如 图 7-8 所 示 。 





图 7-7 ”感知 器 网 络 设置 完成 后 的 “Network” 选 项 卡 图 7-8 生成 的 感知 器 网 络 示意 图 


从 图 7-8 中 可 以 看 出 , 我 们 期 望 建立 的 网 络 是 一 个 单 层 网 络 , 只 包含 单 输入 单 输出 ( 输 
入 向 量 为 二 维 向 量 )、 单 神经 元 结构 ， 采 用 的 传递 函数 为 硬 限 值 函数 ， 这 就 是 期 望 的 感知 
器 神经 网 络 。 
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回 到 7-7 图 中 所 示 的 “Network” 选 项 卡 界面 中 ， 单 击 “Create” 按 钮 ， 在 弹出 的 对 话 
框 中 单 击 "OK "按钮 ， 即 可 以 生成 上 述 网 络 。 随 后 可 以 单 击 "Close" 按 钮 关闭 "Create Network 
or Data” 窗 口 ， 回 到 Network/Data 管理 器 窗口 。 在 其 中 ， 可 以 看 到 新 生成 的 ANDNet 出 现 
在 Network 区 域 中 ， 如 图 7-9 所 示 。 

















图 7-9 创建 感知 器 后 的 Network/Data 管理 器 窗口 
在 此 对 话 框 中 双击 “ANDNet” 或 者 选中 它 然后 单 击 “Open” 按钮 ， 就 可 以 打开 此 生 
成 的 网 络 进行 各 种 编辑 、 训 练 、 仿 真 等 操作 。 
7.1.2 网络 训练 


本 节 介绍 如 何 利用 GUI 图 形 操作 界面 对 7.1.1 节 中 生成 的 网 络 进行 训练 。 

为 了 对 在 7.1.1 节 中 步骤 全 中 生成 的 网 络 进行 训练 ,首先 在 Network/Data 管理 器 中 单 
击 “ANDNet”"， 选 中 该 网 络 对 象 ， 然 后 单 击 “Open” 按钮 ， 将 会 弹出 一 个 新 窗口 ， 窗 口 标 
题 栏 为 “Network:ANDNet"， 如 图 7-10 所 示 。 
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图 7-10 “Network:-ANDNet” 窗 口 


在 此 窗口 中 包含 有 6 个 选项 不， 其 定义 和 功能 分 别 如 下 。 
(1) "View” 选 项 卡 ， 用 于 查看 选中 的 网 络 。 

(2 ) "Train” 选 项 卡 : 用 于 训练 网 络 。 

(3 ) "Simulate” 选 项 卡 : 用 于 对 网 络 进行 仿真 。 
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(4 ) "Adapt” 选 项 卡 ， 用 于 网 络 的 自 适应 训练 

(5 ) “Reinitialize Weights” 选 项 卡 ， 用 于 对 网 络 权 值 重新 初始 化 。 

(6) "View/Edit Weights” 选 项 不， 用 于 查看 和 编辑 网 络 权 值 

为 对 网 络 进行 训练 ， 单 击 “Train” 选 项 卡 ， 其 中 包含 两 个 子 选 项 卡 。 

(1 ) "Training Info” 子 选项 卡 : 设置 网 络 的 输入 样本 与 期 望 输出 。 

( 2 ) "Training Parameters” 子 选项 卡 : 设置 网 络 训练 参数 。 

在 “Training Info” 选 项 卡 中 选 定 “p” 作 为 网 络 输入 ，"t 作为 目标 响应 ， 选 定 后 的 
“Training Info” 选 项 卡 界面 如 图 7-11 所 示 。 
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图 7-11 “Training Info” 选 项 卡 界面 


注意 , 图 中 "Training Results” 区域 的 "Outputs" 和 “Errors” 的 结果 都 含有 "ANDNet_” 
前 邹 , 这 样 做 的 目的 是 为 了 使 得 将 训练 结果 数据 导出 到 MATLAB 工作 区 后 更 加 容易 识别 。 

单 击 “Training Parameters” 选 项 卡 ， 在 此 选项 卡 界面 中 ， 可 以 对 网 络 训练 最 大 和 迭代 次 
数 、 误 差 性 能 目标 进行 设置 ， 该 选项 卡 界面 如 图 7-12 所 示 。 
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图 7-12 “Training Parameters” 选 项 卡 界面 


单 击 窗口 右 下 角 的 “Train Network ” 按钮 ， 即 可 开始 对 此 感知 器 网 络 进行 训练 ， 训 练 
过 程 中 将 会 弹出 如 图 7-13 所 示 的 nntraintool 窗口 。 

这 也 正 是 在 调用 train 函数 对 网 络 进行 训练 时 所 弹出 的 窗口 ,窗口 中 给 出 了 网 络 的 结构 
示意 、 训 练 采 用 的 算法 、 误差 性 能 函数 ， 以 及 训练 过 程 的 动态 显示 。 可 以 看 到 ， 经 过 5 次 
迭代， 网 络 就 完成 了 训练 ， 对 于 感知 器 神经 网 络 ， 训练 的 结果 能 够 达到 零 误 差 ， 而 对 于 其 
他 类 型 的 神经 网 络 则 不 然 。 

单 击 图 7-13 所 示 窗 口中 的 “Performance” 按 钮 ， 即 可 查看 训练 过 程 中 网 络 误差 性 能 
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的 变化 情况 ， 如 图 7-14 所 示 。 








-一 











图 7-13 nntraintool 窗口 图 7-14 训练 过 程 中 误差 性 能 的 变化 
注意 ， 图 中 的 纵 坐标 以 对 数 的 形式 画 出 。 


7.1.3 ”网 络 仿真 


本 节 介 绍 利 用 GUI 图 形 操作 界面 对 前 面 生成 的 感知 器 神经 网 络 进行 仿真 的 过 程 。 

下 面 利用 输入 向 量 书 对 训练 后 的 网 络 对 象 ANDNet 进行 仿真 , 查看 输出 是 否 与 期 望 目 
标 响应 相同 。 

在 “Network:ANDNet” 窗 口中 单 击 “Simulate” 选 项 卡 ， 将 其 中 的 “Inputs” 项 设置 
为 “p”， 如 图 7-15 所 示 。 在 “Simulation Results” 区域 中 的 各 项 同样 也 有 前 级 “ANDNet_"， 
以 清晰 地 显示 变量 所 属 网 络 对 象 。 





图 7-15 “Simulate” 选 项 卡 界面 


单 击 右 下 角 的 “Simulate Network” 按 钮 ， 在 弹出 的 对 话 框 中 单 击 “OK” 按 钮 ， 就 可 
以 对 网 络 进行 仿真 了 。 


仿真 完成 之 后 ， 在 NetworlyData 管理 器 中 , 在 “Output_Data” 区域 会 产生 一 个 新 的 变 
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量 ， 名 为 “ANDNet_outputs”， 如 图 7-16 所 示 。 这 就 是 网 络 仿真 得 到 的 输出 结果 。 


量 大 国 





oz 
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图 7-16 ”仿真 后 的 NetworkyData 管理 器 窗口 


双击 “ANDNet_outputs ， 将 会 弹出 一 个 名 为 “Data: ANDNet_outputs” 的 小 窗口 ， 如 
7-17 所 示 。 





鲜 7-17 仿真 结果 窗口 


从 图 中 可 以 看 到 ， 仿 真 结 果 ANDNet-outputs 的 值 为 [0 0 0 1]， 确 实 是 我 们 期 望 的 目标 
响应 ， 这 说 明 经 过 训练 的 网 络 实现 了 零 误差 输出 。 只 在 两 个 输入 均 为 1 的 情况 下 输出 才 为 
1， 其 他 情况 输出 均 为 0， 这 说 明了 网 络 具 有 逻辑 与 的 功能 。 

单 击 “OK" 按钮 即 可 关闭 此 仿真 结果 窗口 。 


7.1.4 ”图 形 界面 数据 操作 
在 神经 网 络 图 形 界面 中 ， 需 要 对 数据 进行 操作 ， 包 括 从 MAILAB 工作 区 导入 、 导 出 
数据 、 清 除数 据 等 操作 。 下 面 对 这 些 数据 操作 逐一 进行 介绍 。 


1. 导出 数据 


接续 7.1.3 的 步骤 ， 将 感知 器 网 络 的 仿真 结果 导出 到 MATLAB 工作 区 中 。 
回 到 Network/Data 管理 器 窗口 ，ANDNet 网 络 仿真 的 输出 变量 和 误差 向 量 分 别 列 在 窗 
口 右 侧 的 “Outputs” 区 域 和 “Errors” 区 域 。 


单 击 “Export” 接 钮 ， 将 会 弹出 一 个 “Export from NetworkyData Manager” 对 话 框 ， 其 
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中 列 出 了 将 要 导出 的 各 个 变量 ， 此 例 中 的 变量 包括 忆 ，t，ANDNet，ANDNet_outputs， 
ANDNet_errors， 如 图 7-18 所 示 。 


EEC -> 
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图 7-18 “Export from NetworlData Manager” 窗 口 











在 此 窗口 中 ， 除 了 “Select Variables” 变 量 区 域 之 外 ， 还 包含 如 下 5 个 按钮 。 

(1 ) "SelectAll” 按 钮 ， 全 选 输出 变量 。 

(2 ) "Select None” 按 钮 :清除 所 有 选择 。 

( 3 ) "Export” 按 钮 ， 导 出 到 MATLAB 工作 区 。 

(4) "Save” 按 钮 ， 保 存 到 磁盘 文件 。 

(5 ) “Close” 按 钮 : 关闭 窗口 。 

单 击 选择 变量 ANDNet_outputs，ANDNet_errors， 然 后 单 击 “Export” 按 钮 ， 在 弹出 
的 对 话 框 中 单 击 “OK” 按 钮 ， 即 可 将 仿真 结果 导出 到 MATLAB 工作 区 中 。 

我 们 可 以 回 到 MATLAB 工作 区 中 验证 导出 操作 的 结果 ， 输 入 命令 : 

ANDNet_outputs 

输出 结果 为 ， 

ANDNet_outputs = 0 0 0 浊 

输入 命令 : 

ANDNet_errors 

输出 结果 为 ， 

ANDNet_errors = 0 0 0 0 
验证 了 导出 操作 确实 是 成 功 完成 的 。 

采用 同样 的 方式 ， 也 可 以 将 变量 吕 ，+，ANDNet 导出 到 MATLAB 工作 区 中 ， 而 应 用 
同样 的 方法 也 可 以 验证 导出 的 结果 。 

一 旦 网 络 对 象 ANDNet 被 导出 到 了 MATLAB 工作 区 ， 我 们 就 可 以 通过 命令 行 的 方式 
对 网 络 的 参数 进行 查看 。 例 如 ， 输 入 命令 : 
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RNDNet .iwft1,1} 

则 输出 结果 为 : 

ans = 2 证 

输入 命令 : 

ANDNet .bf11} 

则 输出 结果 为 : 

ans = -3 

以 上 就 是 训练 后 的 感知 器 网 络 的 权 值 和 偏差 。 


2.， 清除 数据 

通过 在 Network/Data 管理 器 中 单 击 变 量 名 并 单 击 “Delete"” 按钮 ， 即 可 以 将 变量 删除 ， 
在 所 有 的 变量 删除 完毕 后 ， 可 以 获得 一 个 清空 状态 的 Network/Data 管理 器 。 

清除 数据 的 另 一 个 方法 是 ,退出 MATLAB 程序 ,然后 重新 启动 MATLAB ,在 MATLAB 
命令 行 中 输入 nntool 命令 , 重新 启动 Network/Data 管理 器 ， 这样 也 可 以 得 到 一 个 清空 状态 
的 Network/Data 管理 器 。 

需要 指出 的 是 ， 如 上 面 实例 所 述 ， 如 果 将 P， 上 等 变量 导出 到 了 MATLAB 工作 区 中 ， 
那么 即使 关闭 了 Network/Data 管理 器 ， 这 些 变 量 仍然 存在 于 MATLAB 工作 空间 ， 不 会 随 
Network/Data 管理 器 的 关闭 而 被 清除 。 


3. 从 工作 区 中 导入 数据 


下 面 介绍 怎样 从 MATLAB 工作 区 中 将 数据 导入 GUI 中。 

为 了 方便 后 面 的 处 理 ， 首 先 关 闭 Network/Data 管理 器 ， 再 输入 nntool 命令 重新 启动 图 
形 操作 界面 。 此 时 的 Network/Data 管理 器 中 不 含有 任何 变量 。 

在 MATLAB 工作 区 中 定义 一 个 变量 ， 输 入 命令 : 


r= [0; 1; 2; 3] 





接 下 来 回 到 Network/Data 管理 器 ， 单 击 “Import” 按 钮 ， 弹 出 一 个 新 窗口 ， 如 图 7-19 
所 示 。 

此 窗口 中 包含 三 个 区 域 。 

(1 ) "Source” 区域 : 选择 从 MATLAB 工作 区 或 从 磁盘 文件 中 导入 数据 。 

(2 ) "Select a Variable” 区 域 : 选择 需要 导入 的 变量 名 。 

(3 ) “Destination” 区 域 : 选择 导入 后 的 变量 名 和 类 型 。 
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图 7-19 “Import to Network/Data Manager” 窗 口 


在 “Source” 区 域 中 选择 “Import from MATLAB workspace"， 在 “Select a Variable" 
区 域 选 择 变量 “r" ， 此 时 “Name” 也 自动 变 为 “r"， 选 择 “Import As” 为 “Input Data"， 
然后 单 击 右 下 角 的 "Import "按钮 ,在 弹出 的 窗口 中 单 击 "r" ,就 可 以 看 到 新 变量 r 从 MATLAB 
工作 区 导入 了 GUI 中 。 导 入 数据 后 的 Network/Data 管理 器 窗口 如 图 7-20 所 示 。 

在 此 窗口 中 ， 双 击 “r” 可 以 查看 其 内 容 ， 弹 出 的 窗口 如 图 7-21 所 示 。 








EECZZDIEDIRSEGSG5 -oo 
3 
当 
已 o | _Bcna | 
图 7-20 “导入 数据 后 的 NetworkyData 管理 器 窗口 图 7-21 查看 导入 数据 内 容 
可 以 看 到 ， 数 据 确实 无 误 地 被 导入 到 了 GUI 空间 中 。 
4 数据 保存 与 读 取 


下 面 介绍 如 何 对 数据 进行 保存 和 读 取 操 作 。 

首先 打开 Network/Data 管理 器 ， 随 后 单 击 “New Network” 按 钮 ， 将 新 的 网 络 名 称 设 
置 为 “mynet"， 选 择 网 络 类 型 为 竞争 性 网 络 ， 选 择 前 面 提 过 的 “r” 作 为 输入 向 量 ， 如 图 
7-22 所 示 。 

单 击 “Create” 按钮 ， 在 弹出 的 对 话 框 中 单 击 “OK"” 按钮 ， 于 是 就 创建 了 名 为 “mynet” 
的 网 络 对 象 ， 并 且 该 对 象 出 现在 Network/Data 管理 器 的 Networks 区 域 中 。 

随后 将 其 导出 到 磁盘 文件 。 在 NetworkyData 管理 器 中 , 单 击 "Export" 按钮 , 再 在 Export 
窗口 的 “Select Variables” 区 域 选择 “mynet” 作 为 导出 对 象 ， 如 图 7-23 所 示 。 
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图 7-22 ”创建 “mynet” 网 络 对 象 图 7-23 选择 导出 对 象 


在 此 窗口 中 , 单 击 “Save” 按钮 即 可 将 其 保存 为 磁盘 文件 ， 将 文件 名 命名 为 “mynet ， 
如 图 7-24 所 示 ， 格 式 为 MAT 文件 。 以 上 就 是 将 GUI 中 变量 保存 为 磁盘 文件 的 过 程 。 






下 面 将 GUI 中 的 变量 删除 ， 然 后 再 通过 文件 导入 回来 。 

首先 回 到 Network/ Data 管理 器 ， 单 击 “mynet” 变 量 ， 再 单 击 “Delete” 按 钮 ， 就 将 
此 变量 从 空间 中 删除 。 随 后 单 击 “Import” 按 钮 ， 在 弹出 的 Import 窗口 中 选择 “Load from 
Disk File"， 然 后 利用 “Browse"” 按 钮 找到 刚才 保存 的 myneLMAT 文件 ， 将 其 导入 即 可 ， 
如 图 7-25 所 示 。 


图 7-25 ”从 磁盘 文件 导入 mynet 网 络 对 象 
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单 击 “mynet"， 然 后 单 击 “Load” 按 钮 ， 就 可 以 将 此 变量 重新 导入 到 Network/ Data 
管理 器 窗口 中 ， 读 入 数据 后 的 Network/ Data 管理 器 窗口 如 图 7-26 所 示 。 





| | 
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图 7-26” 读 入 数据 后 的 Network/ Data 管理 器 窗口 
从 图 中 可 见 ， "mynet” 变 量 又 重新 出 现在 “Networks” 区 域 中 。 


数据 拟 合 GUI 工具 nftool 


上 面 介绍 了 基础 GUI 工具 nntool 的 使 用 。 除 此 之 外 ，MATLAB 神经 网 络 工具 箱 还 为 
函数 拟 合 、 模 式 识别 、 数 据 聚 类 方面 的 应 用 ， 提 供 了 几 个 专门 的 GUI 工具 ， 分 别 是 nftool、 
nprtool、nctool。 其 中 函数 拟 合 GUI 工具 nftool 我 们 在 第 2 章 中 已 经 进行 了 介绍 ， 这 里 将 
对 其 他 两 个 工具 的 应 用 进行 实例 介绍 。 

神经 网 络 的 一 个 非常 重要 的 应 用 方向 就 是 函数 拟 合 , 利用 非常 简单 的 网 络 就 可 以 实现 
对 实际 问题 中 较 复杂 的 数据 关系 的 拟 合 。 对 于 一 个 实际 的 函数 拟 合 问题 ， 在 MATLAB 神 
经 网 络 工具 箱 框架 下 ， 用 户 可 以 选择 如 下 三 种 方式 进行 处 理 : 

(1 ) 应 用 命令 行 方式 创建 网 络 进行 处 理 ， 这 种 方式 是 我 们 后 续 章节 中 主要 介绍 的 。 

( 2 ) 应 用 神经 网 络 拟 合 GUI 工具 nftoolo 

(3 ) 应 用 基本 GUI 工具 nntool 进行 处 理 。 

在 此 ， 我 们 选择 nftool 进行 实例 分 析 。 


【 例 7-2】〗】  nftool 分 析 实 例 。 假 定 有 一 个 房屋 价格 问题 , 现 有 506 个 住房 的 13 组 相关 
数据 构成 的 样本 数据 集 ， 该 数据 集 由 MATLAB 以 示例 数据 的 形式 提供 ， 利 用 nftool 工具 ， 
设计 一 个 神经 网 络 ， 对 住房 市 场 价格 进行 拟 合 分 析 。 

解 ， 人 @ 首先 调用 nftool 命令 ， 打 开 拟 合 图 形 界面 窗口 ， 输 入 命 


mnftool 


打开 的 nftool 窗口 如 图 7-27 所 示 。 
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7-27 nftool GUI 工具 窗口 


全 单 击 “Next” 按钮 ， 进 入 到 数据 选择 窗口 ， 如 图 7-28 所 示 。 








四 一 一 











本 | 
图 7-28 nftool 数据 选择 窗口 





在 此 窗口 中 , 可 以 通过 三 种 方式 选择 网 络 训练 的 样本 数据 。 可 以 单 击 窗口 中 的 "Inputs” 
和 “Targets” 下 拉 列 表 框 从 MATLAB 工作 空间 中 选取 样本 数据 ， 也 可 单 击 后 面 的 “…” 
按钮 从 文件 中 导入 数据 ， 此 外 ， 也 可 单 击 “Load Example Data Set 按钮 ， 导 入 MATLAB 
提供 的 实例 样本 数据 。 

此 处 ， 我 们 选择 MATLAB 提供 的 样本 数据 ， 单 击 “Load Example Data Set” 按 钮 ， 选 
择 “House Pricing” 数 据 集 选项 ， 此 数据 集 共 有 506 个 住房 数据 ， 数 据 为 13x506 的 矩阵 ， 
各 行 定义 分 别 为 : 

(1 ) 城镇 犯罪 率 。 

( 2 ) 城镇 面积 在 25000 平方 英尺 以 上 的 居住 面积 比例 。 

( 3 ) 城镇 非 零 售 商业 区 比例 。 

(4 ) 是 否 临河 。 

(5 ) 氨 氧 浓度 ( ppm ) 
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(6 ) 居民 平均 房间 数 。 

(7 ) 1940 年 之 前 的 住房 单元 比例 。 

(8) 到 5 个 商业 中 心 的 加 权 距离 。 

(9 ) 高 速 公 路 指数 。 

( 10 ) 税率 。 

( 11 ) 小 学 受 教育 率 。 

( 12 ) 1000(Bk - 0.63)，Bk 为 城镇 黑人 数 。 

( 13 ) 低 生活 质量 居民 人 口 百分比 。 

单 击 “Import” 按 钮 ， 导 入 数据 ， 回 到 图 7-28 所 示 界 面 。 

侠 单 击 "Next"” 按钮 ， 进入 到 验证 与 测试 数据 窗口 ， 如 图 7-29 所 示 。 








7-29 nftool 验证 与 测试 数据 窗口 


在 此 窗口 中 ， 可 以 设 定 用 来 进行 训练 的 样本 数据 、 验 证 数据 ， 以 及 测试 数据 比例 。 可 
根据 默认 的 比例 设 定 ， 应 用 样本 数据 的 70% 进 行 训练 ，15% 进 行 验证 ，15% 进 行 测试 。 

图 单 击 “Next” 按钮 ， 进 入 网 络 尺寸 设置 窗口 ， 如 图 7-30 所 示 。 设 置 网 络 尺寸 ， 即 
隐 层 神经 元 数目 为 默认 的 20 个 神经 元 。 
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图 7-30 nftool 网 络 尺寸 设置 窗口 
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合 单 击 “Next” 按 钮 ， 进 入 网 络 训练 窗口 ， 如 图 7-31 所 示 。 








2 
图 7-31 nftool 网 络 训练 窗口 
图 单 击 网 络 训练 窗 口中 的 “Train” 按 钮 ， 开 始 网 络 训练 ， 训 练 过 程 中 会 自动 弹出 


nntraintool 窗口 ， 在 此 窗口 中 单 击 “plotperform” 按 钮 ， 将 绘 出 网 络 误差 性 能 随 训练 而 变 
化 的 曲线 ， 曲 线 如 图 7-32 所 示 。 




















图 7-32 网络 性 能 变化 曲线 


单 击 nntraintool 窗口 中 的 “Regression” 按 钮 或 nftool 网 络 训练 窗 口中 的 “Plot 
Regression” 按 钮 ， 将 绘 出 训练 数据 、 验 证 数据 、 测 试 数据 的 曲线 回归 情况 ， 如 图 7-33 所 
示 。 而 nntraintool 窗口 中 的 “Fit” 按 钮 和 nftool 训练 窗口 中 的 “Plot Fit” 按 钮 ， 则 只 能 用 
于 单 输入 单 输出 的 回归 绘图 。 

7-33 中 , 左上 和 角 为 训练 数据 的 拟 合 情 况 ,右上 角 为 验证 数据 的 拟 合 情 况 , 左下 角 为 
测试 数据 的 拟 合 情 况 ， 而 右 下 角 为 全 体 数据 的 拟 合 情 况 。 

命 单 击 “Next"” 按钮 ， 可 以 进入 到 网 络 评估 窗口 ， 如 图 7-34 所 示 。 在 此 窗口 中 ， 可 
以 通过 增加 或 减少 网 络 隐 层 中 神经 元 的 数目 ,或 者 应 用 新 的 数据 、 对 创建 的 网 络 进行 评 估 ， 
这 里 不 再 歼 述 。 
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图 7-33 数据 回归 情况 


接 下 来 单 击 “Next” 按 钮 ， 进 入 到 结果 保存 窗口 ， 如 图 7-35 所 示 。 在 此 窗口 中 可 以 将 
生成 的 网 络 等 数据 保存 到 MATLAB 工作 空间 ， 或 者 产生 相应 的 Simulink 框图 。 为 要 保存 的 
变量 命名 ， 然 后 单 击 “Finish” 按 钮 ， 即 可 完成 此 曲线 拟 合 过 程 。 








外 一 一 一 ee 


2 





图 7-34 _nftool 网 络 评估 窗口 图 7-35 _nftool 结果 保存 窗口 


模式 识别 GUI 工具 nprtool 


模式 识别 是 神经 网 络 的 重要 应 用 方向 , 对 此 , MATLAB 神经 网 络 工具 箱 提 供 了 专门 的 
nprtool 模式 识别 GUI 工具 ， 利 用 此 工具 ， 我 们 可 以 快速 地 进行 模式 识别 的 应 用 和 学 习 ， 
下 面 对 其 进行 介绍 。 
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对 于 模式 识别 ， 首 先 需要 设置 输入 向 量 和 代表 不 同 模式 的 输出 向 量 ， 每 个 输入 向 量 以 
列 向 量 的 方式 排列 形成 输入 网 络 ， 输 出 向 量 则 代表 每 个 输入 向 量 所 属 的 类 别 。 例 如 下 列 语 
名 定义 了 四 个 二 元 输入 向 量 及 其 分 别 对 应 的 两 个 类 别 : 

inputs = [0 101;0011]; 

targets = [0 1 0 1]7 

上 面 的 问题 对 应 于 两 类 的 模式 识别 问题 ， 根 据 输 出 为 MO 即 可 对 两 类 进行 划分 。 在 
MATLAB 中 既 可 以 采用 命令 行 的 方式 解决 此 类 问题 ， 也 可 以 采用 GUI 的 方式 ， 下 面 我 们 
介绍 应 用 GUI 工具 nprtool 解决 此 类 问题 的 步骤 。 


【 例 7-2】 “利用 模式 识别 GUI 工具 nprtool 进行 模式 识别 练习 。 
解 ， 人 @ 输入 nprtool 命令 ， 打 开 模 式 识别 GUI 工具 : 


mprtool 


弹出 如 图 7-36 所 示 的 窗口 。 








图 7-36 nprtool 窗口 


此 GUI 工具 生成 一 个 两 层 的 前 向 型 神经 网 络 ， 在 此 将 其 应 用 于 数据 的 模式 识别 。 
全 单 击 窗口 中 的 “Next” 按钮 ， 进 入 数据 选择 窗口 ， 如 图 7-37 所 示 。 





国 7-37 -nprtool 数据 选择 窗口 
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单 击 “Load Example Data Set” 按钮 ， 调 用 MATLAB 提供 的 样本 数据 ， 弹 出 模式 识别 
数据 集 选择 子 窗口 ， 如 图 7-38 所 示 。 









图 7-38 nprtool 数据 集 选择 子 窗口 


在 此 窗口 中 选择 “Simple Classes"， 然 后 单 击 “Import” 按钮 ， 将 导入 此 简单 分 类 样本 
数据 ， 并 回 到 图 7-37 的 数据 选择 窗口 。 

此 样本 数据 集 为 一 组 二 元 输入 向 量 ， 并 将 其 划 归 为 4 个 类 别 ， 共 含有 1000 个 样本 数 
据 ， 即 输入 样本 向 量 为 一 个 2x1000 矩阵 ， 输 出 样本 向 量 为 一 个 4x1000 和 矩阵 。 输 出 矩阵 每 
一 列 为 一 个 四 元 向 量 ， 元 素 取 值 为 0 或 1， 分 别 表征 四 个 类 别 的 隶属 情况 ， 为 1 表示 属于 
该 类 别 ， 为 0 则 表示 不 属于 该 类 别 ， 如 [0;1;0;0]， 表 示 输 入 向 量 属于 类 别 2。 

图 单 击 “Next” 按钮 ， 进 入 到 验证 与 测试 数据 窗口 ， 如 图 7-39 所 示 。 





图 7-39 nprtool 验证 与 测试 数据 窗口 
选择 将 样本 数据 中 的 15% 分 别 作为 验证 数据 和 测试 数据 。 
付 单 击 "Next” 按 钮 ， 进 入 到 网 络 尺寸 设 置 窗口 ， 如 图 7-40 所 示 。 
默认 网 络 隐 层 神经 元 数目 为 20, 用 户 可 以 将 其 设置 为 任意 合适 的 值 ， 这 里 我 们 采用 默 
认 值 。 
合 单 击 "Next" 按钮 ,将 生成 对 应 的 网 络 ， 并 进入 到 网 络 训练 窗口 ， 如 图 7-41 所 示 。 
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图 7-40 nprtool 网 络 尺寸 设置 窗口 





图 7-41 nprtool 网 络 训练 窗口 


单 击 Train” 按钮， 开始 网 络 训练 ， 训 练 过 程 中 弹出 nntraintool 窗口 ， 此 处 经 过 33 
次 迭代 完成 训练 过 程 。 单 击 nntraintool 窗口 上 的 “Performance 按钮 ， 将 弹出 网 络 误差 曲 


线 ， 如 图 7-42 所 示 。 





图 7.42 ”训练 过 程 中 的 网 络 误差 曲线 
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全 单 击 nntraintool 窗口 上 的 "Confusion" 或 nprtool 网络 训练 窗口 上 的 *Plot Confusiony 
按钮 ， 可 以 绘 出 网 络 对 训练 数据 、 验 证 数据 、 测 试 数据 的 模式 识别 效果 图 , 如 图 7.43 所 示 。 





图 7-43 ”模式 识别 效果 图 


图 7-43 中 , 左上 角 、 右 上 角 、 左 下 角 、 右 下 角 分 别 为 训练 数据 、 验 证 数据 、 测 试 数据 ， 
以 及 全 体 样本 数据 的 识别 效果 。 其 中 ， 绿 色 方 格 代表 各 组 数据 中 各 类 的 真实 比例 情况 ， 红 
色 方 框 代 表 各 类 之 间 错 误 划分 的 情况 ， 灰 色 方 框 内 的 数据 为 每 一 类 数据 的 划分 正确 率 与 错 
误 比率 ， 蓝 色 方 框 代 表 了 整体 的 划分 正确 率 。 可 以 看 到 网 络 对 任意 一 组 数据 的 识别 效果 ， 
红色 方 框 内 的 比例 均 为 0%， 正 确 率 为 100%， 所 以 网 络 的 划分 效果 几乎 是 完美 的 。 

盒 单 击 nprtool 网 络 训练 窗口 上 的 “Next” 按钮， 进入 到 网 络 评估 窗口 ， 如 图 7-44 
所 示 。 





图 7-44 ”nprtool 网 络 评估 窗口 
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在 此 窗口 下 ， 可 以 利用 新 数据 对 网 络 进行 检验 ， 如 果 对 网 络 效果 不 满意 的 话 ， 可 以 重 
新 训练 ， 改 变 神经 元 数目 或 者 采用 新 的 训练 数据 集 。 
在 对 网 络 性 能 满意 之 后 ， 单 击 “Next” 按 钮 ， 进 入 到 数据 保存 窗口 ， 如 图 7-45 所 示 。 
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图 7-45 nprtool 数据 保存 窗口 
选择 希望 保存 的 数据 ， 或 者 选择 生成 对 应 的 M 文件 ， 生 成 M 文件 是 一 个 非常 有 用 的 


选项 ， 有 助 于 我 们 理解 MATLAB GUI 工具 的 实际 工作 原理 。 之 后 ， 单 击 “Finish” 按 钮 即 
完成 此 次 nprtool GUI 工具 的 模式 识别 。 





数据 聚 类 GUI 工具 nctool 


对 数据 进行 聚 类 分 析 是 神经 网 络 一 个 非常 优秀 的 功能 。 所 谓 数据 聚 类 ， 是 指 通过 数据 
的 相似 度 对 数据 进行 归档 。 聚 类 操作 可 能 的 应 用 方向 有 : 

。 通过 对 人 们 的 消费 偏好 分 析 进行 市 场 划分 。 

。 对 数据 进行 数据 挖掘 和 子 集 划 分 。 

。 通过 对 基因 表达 形式 归 类 进行 生物 信息 学 研究 。 

对 数据 进行 聚 类 分 析 ， 同样 可 以 采用 命令 行 、nntool、nctool 三 种 方式 ， 其 中 后 两 种 均 
为 GUI 方式， 这 里 我 们 介绍 如 何 应 用 nctool 进行 聚 类 分 析 。 

【 例 7-3】 “利用 数据 聚 类 GUI 工具 nctool 进行 聚 类 分 析 。 
解 ; @@ 输入 nctool 命令 ， 打 开 模式 识别 GUI 工具 : 

mctool 

弹出 窗口 如 图 7-46 所 示 。 

nctool 通过 创建 一 个 包含 竞争 层 的 自 组 织 映射 网 络 对 输入 数据 集 进行 聚 类 分 析 ， 它 能 
够 表征 的 维 数 与 其 自 组 织 神经 元 数目 相等 ， 神经 元 采用 二 维 拓扑 形式 排列 ， 因 而 能 够 表征 
具有 二 维 拓扑 分 布 性 质 的 数据 集 。 


136 因 区 乱 入 





第 了 章 “MATLAB 神经 网 络 GUI 工具 





图 7-46 nctool 数据 聚 类 GUI 工具 


回 单 击 “Next” 按钮 ， 弹 出 数据 选择 窗口 ， 此 过 程 与 nprtool 工具 的 基本 相同 。 在 此 
窗口 中 单 击 “Load Example Data Set” 按 钮 ， 选 择 使 用 MATLAB 提供 的 样本 数据 集 ， 弹 出 
数据 集 选 择 窗口 ， 如 图 7-47 所 示 。 





图 7-47 nctool 数据 集 选择 窗口 


选择 “Simple Clusters"， 然 后 单 击 “Import” 按 钮 ， 回 到 数据 选择 窗口 。 此 数据 集 具 
有 1000 个 样本 数据 ， 输 入 为 2x1000 矩阵 ， 输 出 划分 为 4 类 。 
侠 单 击 “Next” 按钮 ， 进 入 到 网 络 尺寸 设置 窗口 ， 如 图 7-48 所 示 。 





图 7-48 nctool 网 络 尺寸 设 置 窗口 
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此 二 维 自 组 织 映射 网 络 的 尺寸 默认 设置 为 10， 意 味 着 每 一 边 有 10 个 节点 ， 神经 元 总 
数 为 100 个 ， 我 们 选择 此 默认 值 作 为 待 建立 网 络 的 设置 。 

合 单 击 “Next” 按钮 开始 建立 网 络 ， 此 时 会 进入 到 网 络 训练 窗口， 单 击 “Train” 按 
钮 即 开始 网 络 训练 ， 训 练 过 程 中 弹出 nntraintool 窗口 。 此 过 程 与 nprtool 基本 一 致 

训练 设置 的 最 大 迭代 次 数 为 200, 训练 完成 后 , 回 到 网 络 训练 窗口 。 此 时 窗口 如 图 7-49 
所 示 。 
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图 7-49 训练 完毕 后 的 网 络 训练 窗口 


在 此 窗口 中 单 击 “Plot Sample Hits” 即 可 查看 此 SOM 网 络 对 数据 进行 聚 类 的 命中 结 
果 ， 如 图 7-50 所 示 。 


atal| 








图 7-50 ” 聚 类 命中 结果 


图 中 显示 了 与 每 一 个 神经 元 { 也 就 是 聚 类 中 心 ) 相关 联 的 输入 训练 数据 的 向 量 数目 。 
该 网 络 为 10x10 的 二 维 拓扑 格 点 结构 ， 因此 一 共有 100 个 神经 元 。 从 图 中 可 见 ， 具有 最 大 
命中 数 的 神经 元 命中 数 为 31， 也 就 是 说 ， 有 31 个 输入 样本 被 聚 类 到 了 此 神经 元 中 心 处 。 

同样 ， 可 以 查看 此 网 络 的 权 值 位 置 平面 ， 单 击 “SOM Weight Planes” 按 钮 ， 绘 出 图 形 
如 图 7-51 所 示 。 
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图 7-51 权 值 位 置 平面 


此 图 显示 了 输入 向 量 的 每 一 个 元 素 所 对 应 的 权 值 分 布 情况 ， 对 于 此 例 ， 输 入 向 量 为 2 
维 ， 因 此 有 两 个 输入 。 其 中 黑色 的 部 分 代表 大 的 权 值 ， 浅 色 的 部 分 代表 小 的 权 值 。 

如 果 两 个 输入 对 应 的 权 值 分 布 平面 非常 相似 ， 那么 说 明 这 两 个 输入 相关 度 是 非常 高 
的 。 在 此 例 下 ， 两 者 的 权 值 分 布 平面 相差 很 大 ， 说 明 这 两 个 输入 的 相关 性 非常 低 。 

图 单 击 “Next” 按钮 ， 进 入 网 络 评估 窗口 。 再 次 单 击 “Next” 按钮 ， 即 进入 数据 保 
存 窗口 。 

数据 保存 完毕 之 后 ， 单 击 “Finish” 按 钮 ， 即 完成 此 次 训练 。 此 过 程 同 应 用 nprtool 工 
具 时 一 样 ， 因 此 不 再 详细 叙述 。 


本 章 通过 实例 操作 ,详细 讲述 了 MATLAB 神经 网 络 的 GUI 工具 , 包括 基础 GUI 工具 
nntool、 函 数 拟 合 GUI 工具 nftool、 模 式 识 别 GUI 工具 nprtool， 以 及 数据 聚 类 GUI 工具 
nctoolo 


熟练 应 用 这 些 GUI 工具 ， 才 能 够 快速 上 手 ， 高 效 开 展 神经 网 络 具 体 应 用 的 工作 。 
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在 众多 的 神经 网 络 结构 中 ， 最 简单 的 是 感知 器 神经 网 络 。 感 知 器 ( Perceptron ) 神经 网 
络 传递 函数 采用 的 是 阔 值 函数 ( 硬 限 值 传递 函数 )， 输 出 只 具有 两 个 状态 ， 它 是 美国 学 者 
Rosenblatt 等 人 于 1957 年 在 M-P 模型 和 Hebb 学 习 规则 的 基础 上 提出 来 的 ， 可 以 说 是 最 早 
的 神经 网 络 模型 。 

通过 对 网 络 权 值 和 偏差 进行 训练 ， 可 以 使 感知 器 在 一 组 输入 向 量 下 获得 0 或 1 的 目标 
响应 ， 正 是 由 于 这 个 特点 ， 感 知 器 神经 网 络 特别 适合 于 简单 的 模式 分 类 问题 ， 但 是 通常 也 
只 能 用 来 实现 线性 可 分 的 两 类 模式 识别 。 


感知 器 神经 网 络 结构 


感知 器 虽然 是 最 简单 的 模拟 生物 神经 网 络 的 人 工 模型 ， 但 因为 感知 器 模型 包含 了 自 组 
织 、 自 学 习 的 思想 和 概念 ， 直 观 而 易于 理解 ， 因此 在 神经 网 络 研究 中 具有 重要 的 意义 。 


8.1.1 ”感知 器 神经 元 模型 


8-1 给 出 了 一 个 感知 器 神经 元 的 模型 ， 该 神经 元 具有 尺 个 输入 变量 证 ， 赋 以 不 同 的 
权 值 mw, 之 后 相 加 ， 并 加 入 偏差 (, 通常 也 称 为 神经 网 络 的 阔 值 ， 本 书 中 称 为 偏差 ) 其 
计算 公式 表示 为 : 


mn= 2 Pi+ 


输入 感知 器 神经 元 





=hardlim(Wp+tb) 


图 8-1 ”感知 器 神经 元 模型 示意 图 


感知 器 神经 元 采用 闭 值 函数 ( hardlim ) 作为 网 络 传递 函数 ， 如 图 8-2 所 示 ， 该 函数 根 
据 输 入 是 否 大 于 0， 输 出 为 1 或 者 0。 
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-hardlim(n) 
图 8-2 ” 阔 值 传递 函 孝 图 


正 是 基于 阔 值 函数 的 二 值 特性 , 感知 器 神经 元 可 以 将 输入 的 尺 维 空间 依靠 平面 或 直线 
线性 地 划分 成 两 个 互 不 重 驮 的 区 域 。 当 输入 n<0 时 ， 输 出 为 0; 当 输入 n>0 时 ， 输 出 为 1。 
对 于 一 个 具有 二 维 输入 的 感知 器 神经 元 ， 比 如 其 权 值 和 偏差 分 别 为 : 


w=-1，m2=1，b=1 
它 对 输入 Pu, Pa 构成 的 二 维 平面 的 划分 情况 如 图 8-3 所 示 。 二 维 平面 被 决策 边界 线 分 
荐 为 两 个 区 域 ， 此 输入 空间 所 对 应 的 决策 边界 线 满足 的 方程 就 是 Wp +8 = 0 ， 决 策 边界 线 
与 权 值 矢量 W 正 交 。 在 直线 的 上 部 ， 输 入 向 量 对 应 感知 器 神经 元 的 输出 等 于 1， 而 直线 下 
部 ， 输 入 向 量 对 应 感知 器 神经 元 的 输出 等 于 0。 





图 8-3 ”感知 器 神经 元 对 二 维 平 面 的 分 割 


从 图 8-3 中 可 以 看 到 ， 通 过 改变 偏差 ， 可 以 将 决策 边界 线 上 下 移动 ， 而 调整 权 值 矢 
量 W,， 则 可 以 改变 决策 边界 线 的 斜率 ， 实 现 对 输入 空间 的 不 同 线性 划分 。 而 调整 偏差 和 权 
值 的 过 程 ， 也 就 是 对 网 络 进行 训练 的 过 程 。 


8.1.2 ” 单 层 感知 器 神经 网 络 结构 


一 个 具有 R 维 输入 ，3 维 输出 的 单 层 感知 器 神经 网 络 结构 如 图 8-4 所 示 。 此 神经 网 络 
结构 可 以 表示 为 两 种 形式 , 其 中 左 图 w, 代表 第 j 个 输入 对 第 i 个 神经 元 的 权 值 ; 而 右 图 则 
以 输入 向 量 、 权 值 和 矩阵 的 形式 表示 。 

下 面 以 图 8-4 右 图 的 形式 来 对 网 络 结构 进行 说 明 , 输入 向 量 尸 为 Rxl 维 ， 权 值 矩 阵 多 
为 SxR 维 ， 偏 差 矢量 为 Sx1 维 ， 最 终 输出 向 量 a 为 Sxl 维 ， 从 而 感知 器 的 输出 以 向 量 的 
形式 可 以 表示 为 : 
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Q=hardlim(yYp 二 坊 ) 


其 中 ， 根 据 hardlim 函数 的 运算 结果 ， 输 出 向 量 e 中 的 各 个 元 素 w 取 值 范围 都 为 {0， 
二 } 二 值 区 间 。 








=hardlim(Wp+rb) 





=hardlim(Wp+) 


图 8-4 单 层 感知 器 神经 网 络 结构 示意 图 


在 后 面 的 讨论 中 我 们 将 会 看 到 ， 由 于 感知 器 训练 算法 只 能 训练 单 层 的 网 络 结 构 ， 因 此 
感知 器 神经 网 络 通常 也 采用 单 层 结构 ， 这 在 一 定 程度 上 限制 了 能 够 应 用 感知 器 神经 网 络 的 
范围 。 


感知 器 学 习 规则 


感知 器 神经 网 络 的 可 调 参数 包括 网 络 权 值 和 偏差 ， 这 两 者 的 调整 是 通过 一 定 的 学 习 规 
则 来 实现 的 ， 通 过 对 一 定 输入 样本 的 训练 使 得 调整 后 的 权 值 与 偏差 对 输入 向 量 产生 期 望 的 
目标 响应 ， 使 得 经 过 训练 的 网 络 能 够 完成 对 某 些 特定 的 信息 进行 处 理 的 任务 。 

通常 ， 根 据 学 习 过 程 中 是 否 存在 期 望 目标 响应 ， 神 经 网 络 的 学 习 算 法 可 分 为 有 监督 学 
习 ( supervised learning ) 和 无 监督 学 习 ( unsupervised learming ) 两 种 ， 

在 有 监督 学 习 的 情况 下 ， 需 要 对 网 络 提供 一 系列 正确 的 输入 /输出 训练 样本 : 


{Pt6} (Paz,tz} [Povto} 


其 中 户 是 输入 样本 , 占 是 期 望 的 目标 响应 。 将 期 望 的 目标 响应 与 训练 时 产生 的 目标 输 
出 进行 比较 ， 获 得 网 络 误差 ， 然 后 应 用 学 习 规 则 对 网 络 权 值 和 偏差 进行 调整 ， 使 得 网 络 响 
应 更 接近 于 正确 的 目标 响应 。 

感知 器 神经 网 络 的 学 习 规则 属于 有 监督 学 习 一 类 的 ， 训 练 的 目的 是 得 到 一 个 对 特定 的 
输入 能 够 产生 正确 响应 的 网 络 。 

对 于 无 监督 学 习 的 情况 ,训练 中 不 提供 目标 响应 样本 ， 网 络 权 值 与 偏差 仅仅 根据 输入 
来 进行 调整 。 大 多 数 的 这 种 学 习 规则 采用 聚 类 法 ， 将 输入 归于 有 限 的 种 类 ， 无 监督 学 习 规 
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则 通常 只 适用 于 特定 的 网 络 。 


8.2.1 ”感知 器 网 络 学 习 算法 


通过 训练 ， 感 知 器 网 络 可 以 对 输入 向 量 产生 期 望 的 0 或 1 的 目标 输出 ， 下 面 对 其 学 习 
规则 进行 介绍 。 

假设 是 训练 时 提供 的 输入 向 量 ，t 是 期 望 的 输出 向 量 ， 训 练 时 感知 器 实际 的 输出 向 
量 为 e， 训 练 的 目标 是 尽量 地 减 小 偏差 e=t-a。 要 注意 ， 提 供 的 期 望 输出 向 量 ! 的 取 值 范围 
必须 为 0 和 1， 因 为 感知 器 神经 网 络 只 能 够 输出 这 两 个 值 。 根 据 输 入 向 量 和 网 络 输出 的 值 ， 
感知 器 的 学 习 规 则 是 根据 下 面 几 种 情况 来 进行 参数 调整 的 。 

( 1 ) 对 于 提供 的 输入 向 量 ,如 果 对 第 ;个 神经 元 的 输出 响应 是 正确 的 , 即 e =# -a =0， 
则 不 对 这 个 神经 元 的 权 值 矢量 w; 进 行 修改 。 

(2 ) 如 果 某 个 神经 元 的 输出 为 0， 而 期 望 响 应 为 1， 则 将 此 时 权 值 矢量 w 加 上 输入 向 
量 忆 作 为 新 的 权 值 矢量 。 这 样 可 以 使 得 神经 元 权 值 矢量 更 加 接近 输入 向 量 ， 增 加 将 输入 向 
量 划 归 为 1 的 概率 。 

( 3 ) 如 果 某 个 神经 元 的 输出 为 1， 而 期 望 响应 为 0， 则 将 此 时 权 值 矢量 w; 减 去 输入 向 
量 忆 作为 新 的 权 值 矢量 。 这 样 可 以 使 得 神经 元 权 值 矢量 更 加 远离 输入 向 量 ， 从 而 增加 将 输 
入 向 量 归 类 于 0 的 概率 。 

以 上 三 种 情况 的 权 值 修正 公式 可 以 由 一 个 表达 式 给 出 ， 即 ; 


Awi = 一 a)pP=ep ， 其 中 ，i=12…,S 
而 偏差 的 修正 公式 则 为 : 
Abi = 一 ai =e， 其 中 ，i=12…3 


对 于 单 层 感 知 器 神经 网 络 整体 而 言 ， 其 权 值 和 矩阵 与 偏差 矢量 的 修正 就 可 以 写 为 


A 印 =(t-a)pT=epT 


A5=(L-a)=e 
从 而 新 的 权 值 和 靖 值 为 
Waew = 了 +A 多 = 卫 +epT 
Boew = 有 +AD = 五 +e 
其 中 ，e=t-ao 


感知 器 学 习 规则 的 本 质 就 是 权 值 变 化 量 等 于 正 负 输 入 向 量 。 每 进行 一 次 权 值 修正 ， 感 
知 器 产生 正确 响应 的 几率 就 会 有 所 提高 ， 此 学 习 规 则 属于 梯度 下 降 算法 。 对 于 此 算法 已 经 
证 明 ， 如 果 解 存在 ， 则 该 算法 在 经 过 有 限 次 的 迭代 运算 后 能 够 收敛 到 正确 的 目标 向 量 * 

MATLAB 中 用 来 计算 感知 器 权 值 修正 量 的 函数 为 learnp, 我 们 将 在 8.3 节 中 进行 介绍 。 
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8.2.2 ”标准 化 感知 器 网 络 学 习 算法 
我 们 知道 ， 一 般 的 感知 器 学 习 规则 权 值 调整 采用 的 公式 是 : 
A 了 =(t-a)pT=epT 


可 以 见 到 ， 输 入 向 量 咏 越 大 ， 则 权 值 的 变化 也 就 越 大 ， 因此 当 输入 样本 中 存在 奇异 样 
本 的 时 候 ， 会 让 权 值 产生 一 个 非常 大 的 变化 ， 而 占 大 多 数 的 小 样本 则 需要 花费 很 多 的 时 间 
才能 够 抵消 少量 的 奇异 样本 引起 的 权 值 的 变动 。 

因此 对 于 输入 样本 中 含有 奇异 样本 的 情形 ， 感 知 器 网 络 的 训练 时 间 会 大 大 增加 ， 为 了 
解决 这 个 问题 , 人 们 提出 了 一 种 改进 的 感知 器 学 习 规 则 ， 即 所 谓 的 标准 化 感知 器 学 习 规则 。 

标准 化 的 学 习 规 则 的 目标 是 使 得 奇异 样本 和 其 他 正常 样本 对 权 值 产生 均衡 的 影响 ， 所 
采取 的 权 值 修正 公式 为 : 

了 BT 
”7 辐 一 何 

这 样 相对 于 原始 的 学 习 规则 而 言 ， 标 准 化 学 习 规则 所 用 的 时 间 稍 长 一 些 ， 但 是 通过 归 
一 化 的 方法 ， 避免 了 权 值 调整 过 程 中 发 生 少 数 大 样本 抵消 大 量 小 样本 的 作用 的 情况 ， 从 而 
可 以 应 用 于 奇异 样本 的 输入 情形 。 

在 神经 网 络 工具 箱 中 ， 标准 化 感知 器 网 络 学 习 算 法 是 通过 函数 learmnpn 实现 的 ， 我 们 
将 在 后 面 的 章节 中 进行 介绍 。 


_ 感知 器 网 络 的 MATLAB 实现 


MATLAB 工具 箱 为 我 们 提供 了 关于 感知 器 神经 网 络 操作 的 丰富 函数 ,本 节 我 们 将 针对 
网 络 生成 、 网 络 仿真 、 网 络 学 习 与 训练 ， 以 实例 的 形式 对 与 感知 器 网 络 相关 的 MATLAB 
工具 箱 函 数 进行 介绍 。 


8.3.1 ”感知 器 网 络 的 生成 
利用 MATLAB 工具 箱 函数 newp 可 以 生成 一 个 感知 器 神经 网 络 ， 其 调用 格式 如 下 
net = newp(PR, S, TF, LP) 
其 中 各 参数 意义 如 下 
。PR 为 Rx 2 阶 矩 阵 ， 由 R 个 输入 元 素 的 最 小 值 与 最 大 值 组 成 ; 
。 3 为 神经 元 的 数目 ; 
e TF 为 传递 函数 ， 默 认 值 为 hardlim ; 
。LF 为 学 习 函 数 ， 默 认 值 为 learp'。 
函数 返回 值 net 是 一 个 结构 体 ， 代 表 生 成 的 感知 器 神经 网 络 的 对 象 因为 TF，LF 具 
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有 默认 的 hardlim 与 Jearp' 值 ， 因此 调用 该 函数 时 , 生成 一 般 的 感知 器 时 可 以 采用 下 述 默认 
调用 格式 


net = newp(PR, S) 


【 例 8-1】 感知 器 网 络 生成 实例 。 生 成 一 个 一 维 输入 、 具 有 一 个 神经 元 的 感知 器 神经 
网 络 ， 输 入 的 最 小 值 和 最 大 值 为 [0.2]， 输 出 值 为 0 或 者 1。 


解 : 题目 要 求 的 神经 网 络 可 以 应 用 如 下 命令 来 产生 : 
[0 2]; 


[0 1]; 
net = newp(P,T) 


以 上 命令 将 生成 一 个 新 的 名 为 net 的 感知 器 神经 网 络 对 象 结构 ， 关 于 网 络 对 象 结构 的 
内 容 在 上 一 节 中 已 有 介绍 ， 在 “ 自 定 义 神经 网 络 ”一 章 中 还 将 详细 讲解 ， 此 处 不 再 熬 述 。 

我 们 可 以 输入 命令 来 查看 生成 的 感知 器 神经 网 络 的 内 部 变量 和 参数 。 例 如 ， 网 络 的 输 
入 权 值 保存 在 结构 体 netLintputweights 中 ， 可 以 利用 下 列 语句 来 查看 ， 


inputweights = net.inputweights{1,1)} 
输出 结果 为 : 


inputweights = 
delays: 0 
initFcn: 'initzero' 
learn: 1 
learnFcn: 'learnp' 
learnParam: [] 
size: [1 1] 
userdata: [1xl struct] 
weightFcn: "dotprod' 
weightParam: [1xl struct] 


可 以 看 到 的 信息 是 ,网络 采用 了 默认 的 传递 函数 hardlim 和 学 习 算 法 learnp。 而 网 络 传 
输 给 阔 值 函数 hardlim 的 数值 是 权 值 矩 阵 与 输入 向 量 的 点 积 ( dotprod ) 。 网 络 权 值 初始 化 
函数 采用 了 initzero， 这 表示 对 权 值 初 值 采 取 了 赋 0 处 理 。 

同样 ， 我 们 也 可 以 查看 网 络 偏差 的 信息 ， 在 MATLAB 命令 窗口 中 输入 : 

biases = net.biases{1) 

输出 结果 为 : 


biases = 
initFcn: initzero' 
learn: 1 
learnFcn: 'learnp' 
learnParam: [] 
size: 1 
userdata: [1xl1 struct] 


这 说 明 偏 差 初 值 也 赋 了 0 值 。 


[ 
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8.3.2 ”感知 器 网 络 的 仿真 


在 利用 newp 函数 生成 了 感知 器 网 络 之 后 , 我 们 可 以 利用 sim 函数 来 对 网 络 进行 仿真 ， 
得 到 在 一 定 输入 向 量 下 的 网 络 响应 。 


【 例 8-2】 “感知 器 网 络 仿真 实例 。 生 成 一 个 输入 向 量 取 值 范围 为 -2,2;-2.2]、 输 出 响应 
取 值 范围 为 [0,1] 的 单 神经 元 的 感知 器 网 络 ， 利 用 sim 函数 进行 仿真 。 
解 ， 题 目 要 求 的 神经 网 络 可 以 利用 下 列 语 名 生成: 

net = newp([-2 2;-2 2],[0 1]); 

这 样 生成 的 网 络 其 权 值 与 偏差 均 为 0。 如 果 我 们 想 要 改变 其 权 值 与 偏差 ， 可 以 通过 下 
列 的 语句 进行 赋值 ， 在 MATLAB 命令 窗口 中 输入 : 


net .INW{1,1)= [-1 1]); 
net.bf1l) = [1]， 


这 样 就 将 权 值 冉 值 为 -1,1]， 而 偏差 赋值 为 1。 更 改 后 可 以 通过 命令 进行 查看 ， 在 
MATLAB 命令 窗口 中 输入 : 

net .IW{1,1)} 

得 到 ， 

ans = 二 工 

输入 命令 ， 

net .b{1)} 

输出 结果 为 ， 

ans = 工 


下 面 通过 sim 函数 来 对 网 络 进行 仿真 ， 并 查看 此 网 络 对 于 特定 输入 向 量 的 响应 输出 。 
查看 第 一 个 输入 向 量 ， 输 入 下 列 命令 : 


pl = [1;1])， 
al = sim(net,pPl) 


得 到 : 
al = 二 
查看 第 二 个 输入 向 量 ， 输 入 下 列 命令 : 
p2 = [1;-1]， 
a2 = sim(ner,p2) 
得 到 
a2 = 0 


可 以 看 到 ,网络 对 两 个 不 同 的 输入 向 量 产生 的 响应 分 别 为 1，0。 我 们 也 可 以 将 这 两 个 
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输入 向 量 组 成 一 个 输入 向 量 序列 , 则 网 络 响应 输出 也 是 一 个 向 量 序列 , MATLAB 命令 及 执 
行情 况 如 下 : 


p3 = ([1;1] [1;-1]); 
a3 = sim(net,p3) 


得 到 
a3 = [1] [0] 
这 样 我 们 就 实现 了 对 感知 器 网 络 的 仿真 。 


8.3.3 ”感知 器 网 络 的 初始 化 


在 上 一 节 中 ， 我 们 看 到 ， 在 默认 情况 下 应 用 newp 函数 生成 的 感知 器 网 络 的 权 值 与 偏 
差 都 初始 化 为 0， 而 在 仿真 过 程 中 则 改变 了 这 两 者 的 值 ， 如 果 我 们 需要 重 置 感知 器 权 值 和 
偏差 的 话 ， 可 以 使 用 init 函数 。 


【 例 8-3】 ”感知 器 网 络 初始 化 实例 。 利 用 【 例 8-2 】 中 的 感知 器 网 络 ， 练 习 感 知 器 网 
络 的 初始 化 。 
解 : 利用 下 面 的 语句 生成 感知 器 网 络 : 


net = newp([-2 2;-2 2], [0 1]); 
分 别 对 其 权 值 偏差 进行 查看 ， 输 入 命令 
wts = net,.IW{1,1} 
得 到 ， 
WwWtS = 0 0 
输入 命令 : 
bias = net.bf1)} 
输出 结果 为 ， 
bias = 0 
下 面 我 们 设置 网 络 权 值 为 [3,41]， 设 置 偏差 为 5S， 输 入 命令 : 


net.IW{t1l,1I}) = [3,4]7 
net .bfl) = 5; 


重新 检查 改变 后 的 权 值 与 偏差 ， 得 到 : 


ws = 3 人 
bias = 可 


现在 ， 利 用 init 函数 对 网 络 参数 进行 重 置 ， 输 入 命 
net = init(net) 7 
再 度 查看 权 值 与 偏差 ， 即 有 : 
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wts=- 0 
bias = 0 
至 此 ， 我 们 完成 了 网 络 参数 的 重 置 。 
除了 初始 化 为 0 值 之 外 ,也 可 以 利用 Init 函数 将 感知 器 网 络 参 数 初 始 化 为 其 他 的 值 ， 例 
如 在 上 例 中 继续 输入 下 面 的 语句 ， 可 以 将 感知 器 的 初始 权 值 与 偏差 重新 初始 化 为 随机 数 : 
net .inputweights{l,1).initFcn = “rands'; 


net .biasesf1llj.initFcn = "ranGs'7 
net = inic(nec) 1; 


查看 权 值 与 偏差 ， 输 出 结果 为 ， 


wts = 0.8116 -0.7460 
biases = 0.6294 


由 此 可 见 ， 感 知 器 的 权 值 与 偏差 都 初始 化 为 了 随机 数 。 


8.3.4 ”感知 器 网 络 的 学 习 和 训练 


1962 年 ，Rosenblatt 宣布 ， 神 经 网 络 可 以 学 会 它 能 够 表示 的 任何 东西 ， 这 极 大 地 促进 
了 神经 网 络 的 发 展 ， 对 于 感知 器 神经 网 络 ， 我 们 在 上 一 节 已 经 介绍 过 其 学 习 算法 ， 这 一 节 
将 对 MATLAB 中 相关 的 函数 进行 介绍 。 

给 定 一 定 的 输入 向 量 P， 以 及 偏差 e, 在 MATLAB 中 应 用 感知 器 训练 函数 learnp 可 以 
计算 需要 对 网 络 权 值 W 和 偏差 /进行 的 修正 ， 此 过 程 采 用 的 算法 为 原始 的 感知 器 网 络 学 
习 算 法 。 

learnp 函数 的 完整 调用 格式 为 : 





[dwW,LS]= learmp(W,P,Z,N,4, 了 7， 屯 , g8W, gA, D,LP LS) 

此 函数 涉及 的 参数 比较 多 ， 在 感知 器 的 学 习 中 ， 通常 只 需要 用 到 其 中 W、P、 巨 三 个 
参数 ， 它 们 分 别 为 网 络 原始 权 值 、 输 入 向 量 和 误差 向 量 ， 其 余 的 参数 置 空 即 可 。dW 为 返 
回 的 权 值 调整 量 。 一 般 情况 下 应 用 感知 器 时 ， 采用 简化 的 调用 格式 即 可 ， 下 面 以 示例 说 明 
其 用 法 。 

【 例 8-4】 ”感知 器 网 络 学 习 实例 。 以 【 例 8-3】 中 的 双 输 入 的 单 神 经 元 感知 器 网 络 为 
例 ， 练 习 感知 器 网 络 学 习 函 数 leamp 的 使 用 。 

解 ， 人 @ 首先 生成 网 络 。 输 入 命令 : 
net = newp([-2 2;-2 2],[0 1])7 
然后 将 偏差 置 为 0， 权 值 置 为 1 和 0.8， 输 入 如 下 命令 : 


net.bll) = [0] 
w= [1 -0.8]; 
met .IW{1,1) = wi 


给 定 的 输入 、 输 出 目标 向 量 分 别 为 : 
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P= [1; 2]; 
= [1]7 


可 以 通过 sim 函数 计算 得 到 网 络 相对 于 期 望 响 应 的 误差 ， 输 入 命令 : 
a = simtnet,p) 


输出 结果 为 


e = 1 
僵 利用 leamp 函数 对 网 络 权 值 进行 调整 。 输 入 命令 ， 
Gw = learnp(tw,p,[l,r,U,0e,r,0,0) 
avw=- 1 2 

新 的 权重 可 以 通过 下 面 的 语句 计算 得 到 ， 

w = w+ dw 

输出 结果 为 ， 

W = 2.0000 1.2000 

已 经 证 明 ， 通 过 循环 调用 learnp 函数 ， 性 全 二 全 作 作 全 和 证， 神经 网 络 的 输 
人 | 期 望 的 目标 响应 。 

在 给 定 的 输入 向 量 下 ， 通 过 不 断 地 调用 sim 和 learnp 函数 ， 根 据 输出 误差 调整 网 络 权 
值 与 偏差 ， 最 终 将 会 得 到 针对 此 输入 期 望 响 应 的 最 优 权 值 和 偏差 ， 给 出 解决 此 问题 的 最 优 
感知 器 网 络 ， 也 就 完成 了 一 次 对 于 网 络 的 训练 过 程 。 

通过 反复 调用 函数 adapt， 或 者 直接 调用 train 函数 都 可 以 完成 这 个 过 程 。 
(1 ) adapt 函数 
调用 adapt 函数 对 感知 器 网 络 进行 训练 的 格式 为 : 


[net a, e] = adapt(net, 疡 ,有 
其 中 等 式 右边 的 net 为 训练 前 的 网 络 对 象 ,左边 的 net 为 训练 后 的 网 络 对 象 , a 和 e 分 
别 为 训练 后 的 网 络 输出 和 误差 。 
(2 ) train 函数 
train 函数 的 调用 格式 如 下 : 
net = train(net 忆 ,四 
其 中 net 是 网 络 对 象 ，P 为 输入 向 量 ，# 为 期 望 输出 响应 。 
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需要 注意 的 是 ,函数 train 并 不 能 够 保证 网 络 完全 产生 期 望 的 目标 响应 。 在 完成 一 次 训 
练 之 后 ， 仍 然 需要 对 新 的 权 值 和 偏差 下 的 网 络 进行 检验 ， 以 确保 对 于 每 一 个 输入 向 量 都 能 
够 产生 期 望 的 输出 响应 。 如 果 发 现 新 的 网 络 并 没有 产生 所 期 望 的 响应 的 话 ， 就 需要 重复 调 
用 train 函数 对 网 络 进行 进一步 的 训练 。 

如 果 经 过 多 次 训练 ， 网 络 性 能 仍然 达 不 到 要 求 的 话 ， 那么 就 需要 仔细 考虑 一 下 ， 此 问 
题 是 否 可 以 通过 感知 器 神经 网 络 来 解决 ， 感知 器 网 络 的 局 限 性 将 在 下 一 节 进 行 介绍 。 

下 面 通过 一 个 简单 的 问题 来 介绍 train 函数 的 使 用 。 


【 例 8-5】 ”感知 器 网 络 训练 函数 train 使 用 实例 。 考虑 一 个 单个 神经 元 构成 的 具有 两 
维 输入 向 量 的 感知 器 神经 网 络 ， 假定 用 于 训练 的 输入 向 量 和 期 望 输出 如 下 : 


浊 
mi-o -| em， -|[ 引 = aa 


对 网 络 进行 训练 ， 使 之 完成 此 分 类 问题 。 
解 ，( 候 生成 感知 器 神经 网 络 。 
仍然 利用 newp 生成 一 个 感知 器 神经 网 络 ， 初始 的 网 络 权 值 和 偏差 均 为 0， 输入 命令 ， 
net = newp([-2 2;-2 2], 50 1]); 
首先 利用 第 一 个 输入 向 量 来 对 网 络 进行 训练 ， 设置 迭代 次 数 为 1， 则 train 函数 只 对 网 
络 参数 进行 一 次 调整 。 输 入 命令 


net .trainParam.epochs = 17 
net = train(net,p,) 1; 


关闭 弹出 的 图 形 窗口 ， 回 到 MATLAB 命令 工作 区 ， 查看 新 的 权 值 和 偏差 ， 输 入 命令 ， 





w = net.iwtl,1}，b = net.btl) 
得 到 ， 

w=- -2 -2 

b- -1 


这 样 ， 经 过 训练 后 的 网 络 权 值 变 成 了 [-2,-2]， 偏 差 变 成 了 -1， 这 里 仅仅 采用 了 忆 作为 
输入 向 量 来 进行 训练 ， 接 下 来 ， 还 需要 应 用 Pa，Pa， 思 三 个 输入 向 量 对 网 络 进行 训练 ， 在 
此 基础 上 进一步 调整 权 值 和 偏差， 从 而 得 到 最 终 符 合 这 四 个 期 望 输出 响应 的 网 络 。 

实际 上 ， 这 个 过 程 可 以 通过 train 函数 一 次 完成 ， 操 作 过 程 如 下 所 示 。 在 MATLAB 命 
令 窗口 中 输入 : 


net = newp([-2 2;-2 2], 10 1]1); 
net .trainparam.epochs = 1 


输入 命令 ， 定 义 输入 向 量 和 期 望 输出 序列 : 


p = [[2;21 [1;-2) [-2;2] [-1;1]] 
=[I0101] 
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输入 命令 ， 应 用 此 输入 输出 序列 对 网 络 进行 训练 : 
net = train(net,p,) 
输入 命令 ， 查 看 训练 得 到 的 权 值 和 偏差 : 


w =net.iwftl,1}，b = net.bf1l)} 


输出 结果 为 : 
w=- -3 -1 
b = 0 


合 训练 网 络 。 用 sim 函数 对 训练 生成 的 网 络 进行 仿真 ， 检验 对 于 每 一 个 输入 向 量 是 
否 能 够 得 到 期 望 的 输出 响应 。 

输入 命令 : 

a = sim(net,p) 

输出 结果 为 ， 

a = 0 1 

此 时 会 发 现 , 生成 的 网 络 并 没有 符合 我 们 的 预期 , 我 们 需要 对 网 络 进行 多 次 适 代 调 整 ， 
所 以 可 以 改变 最 大 迭代 值 ， 重 新 训练 。 输 入 命令 : 


net .上 rainParam.epochs = 1000; 
net = train(net,p,t) 


此 时 弹出 的 图 形 窗口 中 显示 “performance goal meet"。 回 到 MATLAB 命令 工作 区 , 再 
查看 权 值 与 误差 ， 输 入 命令 : 


w =w = net.iw(1,1}，b = net.bf1l) 


输出 结果 为 : 


b 
再 次 进行 仿真 ， 输 入 命令 

a = sim(net,p) 

输出 结果 为 : 

a = 0 1 0 1 
输入 命令 : 

error = at 

输出 结果 为 : 

error = 0 0 0 0 


至 此 ， 通 过 训练 ， 感 知 器 神经 网 络 收敛 到 了 期 望 的 输出 响应 。train 函数 除了 用 于 感知 
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器 神经 网 络 的 训练 之 外 ， 也 可 以 进行 其 他 种 类 的 神经 网 络 的 训练 ， 在 后 面 的 章节 中 会 继续 
介绍 。 





感知 器 网 络 的 局 限 性 


由 于 感知 器 的 出 现 ， 神 经 网 络 在 20 世纪 40 年 代 就 初步 展现 了 它 的 功能 和 诱 人 的 发 展 
前 景 ，20 世纪 60 年 代 ， 在 Rosenblatt 等 人 的 推进 下 ， 感 知 器 的 研究 又 获得 了 更 大 的 发 展 。 
正当 人 们 为 取得 的 进展 高 兴 的 时 候 ， 却 发 现 了 很 多 应 用 神经 网 络 无 法 解决 的 问题 。 

Minsky 进行 研究 后 得 出 结论 , 单 层 的 神经 网 络 无 法 解决 异 或 等 基本 的 问题 , 这 使 得 神 
经 网 络 的 发 展 一 下 受到 了 阻碍 ， 从 第 一 个 高 潮 期 进入 了 反思 期 。 在 本 节 我 们 对 感知 器 网 络 
所 具有 的 局 限 性 进行 介绍 。 


8.4.1，” 单 层 感知 器 网 络 的 局 限 性 


由 于 感知 器 神经 网 络 在 结构 和 学 习 规则 上 的 局 限 性 ， 使 得 其 应 用 也 受到 一 定 的 限制 。 
它 的 局 限 性 主要 包括 以 下 几 点 

(1 ) 由 于 采用 harlim 也 就 是 羡 值 函数 作为 网 络 传递 函数 ， 所 以 感知 器 的 输出 只 能 为 0 
或 1 两 个 值 。 

({ 2 ) 单 层 感知 器 神经 网 络 只 能 够 解决 线性 可 分 的 模式 分 类 问题 ， 也 就 是 说 ， 只 能 够 对 
线性 可 分 的 输入 样本 进行 分 类 识别 ， 而 对 于 线性 不 可 分 的 输入 样本 就 显得 无 能 为 力 了 ， 即 
使 是 通过 网 络 学 习 ， 也 无 法 达到 分 界 点。 不 过 ， 对 于 线性 可 分 的 情形 ， 只 要 通过 训练 ， 总 
能 在 有 限 的 循环 次 数 内 使 网 络 达到 期 望 值 ， 这 是 经 过 证 明 的 。 

(3 ) Minsky 证 明 ， 单 层 感 知 器 网 络 无 法 实现 简单 的 异 或 远 辑 。 

(4 ) 采用 常规 感知 器 学 习 算法 的 感知 器 神经 网 络 ， 如 果 遇 到 含有 奇异 样本 的 输入 向 量 
的 时 候 ， 即 少数 样本 相对 于 其 他 样本 非常 大 时 ， 对 其 训练 所 需要 收敛 时 间 将 会 变 得 很 长 。 
这 一 点 已 经 在 前 面 的 标准 化 感知 器 学 习 算 法 中 介绍 了 。 
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为 改善 单 层 感知 器 网 络 对 于 较为 复杂 模式 分 类 问题 的 局 限 性 ，20 世纪 60 年 代 人 们 发 
展 了 多 层 感知 器 神经 网 络 ， 在 网 络 中 包含 了 一 层 以 上 的 感知 器 神经 元 ， 这 样 在 输入 层 与 输 
出 层 之 间 增 加 一 些 隐 层 ， 网 络 得 以 实现 一 些 更 复杂 的 功能 ， 一 个 多 层 感知 器 模型 如 图 8-5 
所 示 。 

多 层 感知 器 可 以 用 于 解决 一 些 单 层 感 知 器 所 无 法 解决 的 比较 困难 的 问题 。 例 如 我 们 要 
将 4 个 输入 向 量 分 为 4 类 ， 应 用 单 层 感知 器 神经 网 络 只 能 得 到 一 条 决策 边界 线 ， 无 法 进行 
4 类 模式 的 划分 ， 然 而 应 用 多 层 神经 元 构成 的 感知 器 网 络 ， 我 们 就 可 以 通过 两 条 线 将 输入 
向 量 划分 为 4 类 ， 从 而 解决 这 一 类 问题 。 
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输入 层 陷 层 
图 8-5 多 层 感 知 器 模型 示意 图 


此 外 ， 对 于 Minsky 提出 的 单 层 感知 器 所 无 法 解决 的 异 或 问题 ， 应 用 二 层 感 知 器 网 络 
也 可 以 成 功 地 解决 。 


感知 器 神经 网 络 设计 实例 
下 面 通过 4 个 综合 实例 ， 讲 述 感 知 器 神经 网 络 的 设计 。 


8.5.1 输入 向 量 的 二 类 划分 


【 例 8-6】 利用 一 个 二 输入 感知 器 网 络 ， 完 成 对 4 个 二 维 输入 向 量 的 分 类 。 下 面 的 二 
维 数组 尸 每 一 列 对 应 一 个 二 维 输入 向 量 ，T 是 对 应 向 量 期 望 的 目标 响应 。 
解 : (D 在 MATLAB 命令 区 进行 P，7 的 定义 ， 并 用 函数 plotpv 在 二 维 输入 平面 上 画 出 输 
入 向 量 与 期 望 响应 示意 图 ， 如 图 8-6 所 示 。 输 入 命令 : 

Pa[.-0.5 -0.5 +0.3 -0.15; 

-0.5 +0.5 -0.5 +1.0]7 
zz=[I1100]，; 
Plotpv(P,T) 7 
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图 8-6 ”输入 向 量 与 期 望 响 应 样本 图 
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全 生成 网 络 。 我 们 构造 的 神经 网 络 必须 能 够 将 这 4 个 输入 向 量 己 依据 期 望 响 应 了 进 
行 正确 的 二 类 划分 。 所 幸 的 是 ， 对 于 这 类 简单 的 二 类 模式 划分 问题 ， 感 知 器 神经 网 络 是 足 
以 胜任 的 。 

首先 ， 利 用 newp 函数 生成 一 个 感知 器 神经 网 络 对 象 ， 输 入 向 量 的 最 小 和 最 大 值 分 别 
为 -1 和 1， 表 示 为 [-1 1;-1 I]， 层 数 为 1。 输 入 命令 : 


net = newp([-1 1;-1 1],1)7 


我 们 可 以 在 输入 向 量 与 期 望 响 应 图 加 上 生成 感知 器 网 络 的 决策 分 界线 ， 这 样 就 可 以 看 
到 此 网 络 对 于 输入 向 量 的 划分 情况 。 

然而 到 目前 为 止 ， 感 知 器 网 络 的 权 值 与 偏差 都 是 初始 化 为 0 的 ， 因 此 在 画 出 的 图 上 仍 
然 看 不 到 决策 分 界线 。 如 果 分 界线 存在 的 话 ， 可 以 使 用 以 下 命令 绘 出 分 界线 


Plocpv(P,T) 7 
Plocpc (nec .IW{1) ,net.bt1))7 


合 训练 网 络 。 由 于 初始 化 的 网 络 不 能 完成 对 输入 向 量 的 划分 ， 因 此 我 们 需要 对 网 络 
进行 训练 ， 使 其 能 够 适用 于 此 问题 的 解决 。 

这 里 ， 我 们 将 介绍 另 一 个 训练 函数 adapt。 此 函数 执行 的 结果 将 会 返回 一 个 新 的 网 络 
对 象 、 输 出 ， 以 及 误差 。 输 入 命令 : 

net .adaptParam.passes = 3 

net = adapt(net,P,T) 

plotpc(tnet .IW{1} ,net.bf1)); 

执行 上 面 的 命令 ， 我 们 就 可 以 看 到 结果 ， 如 图 8-7 所 示 ， 训 练 后 的 感知 器 的 网 络 决策 
分 界线 成 功 地 对 两 类 输入 样本 进行 了 分 类 。 
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图 8-7 训练 后 的 网 络 对 输入 样本 的 分 类 


合 网 络 仿真 。 现 在 ， 可 以 应 用 sim 函数 来 进行 网 络 仿真 ， 实 现 对 任何 其 他 输入 向 量 
的 模式 划分 了 。 

用 MATLAB 命令 完成 此 过 程 ， 并 将 计算 结果 添加 在 图 8-7 上 ， 最 后 得 到 的 结果 如 图 
8-8 所 示 。 可 以 看 到 ， 新 的 输入 向 量 在 箭头 标记 的 位 置 处 ， 根 据 响应 a 的 值 被 划 归 到 了 上 
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半 平 面 。 
输入 的 MATLAB 命令 为 ， 
hold on; 


DP= [0.7; 工 .2]7 
a = sim(net,p); 
plotpv(p,a);xlim([-1,0.8]),ylim([-1,1.5]); 
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PD) 
图 8-8 ”新 输入 样本 的 分 类 仿真 结果 


在 此 实例 中 ， 我 们 首先 利用 newp 生成 感知 器 网 络 ， 利 用 adapt 函数 对 网 络 进行 训练 ， 
然后 通过 sim 进行 网 络 仿真 ， 从 而 应 用 感知 器 网 络 完成 了 一 个 简单 的 二 类 模式 划分 问题 。 
简单 的 二 类 模式 划分 是 感知 器 最 适用 的 场合 。 


8.5.2 ”奇异 样本 输入 向 量 的 训练 


【 例 8-7】 应 用 一 个 含有 奇异 样本 的 输入 向 量 与 期 望 样本 序列 ， 对 一 个 感知 器 神经 网 
络 进行 训练 ， 使 其 达到 二 类 模式 划分 的 目标 。 

在 此 例 中 我 们 将 会 看 到 ， 由 于 输入 序列 中 存在 一 个 非常 大 的 奇异 样本 ， 训 练 时 间 将 会 
远 远大 于 正常 样本 所 需要 的 时 间 。 


解 ， 人 @@》 定义 输 入 向 量 与 期 望 响应 样本 ， 然 后 利用 plotpv 函数 画 出 输入 向 量 与 期 望 响应 样 
本 。 输 入 命令 : 


P = [-0.5 -0.5 +0.3 -0.1 -40; 

-0.5 +0.5 -0.5 +1.0 50]) 

有 

Plotpv{(P,T) ; 

绘 出 图 形 如 图 8-9 所 示 。 

从 图 中 可 以 看 到 ， 在 5 个 输入 样本 点 中 ， 有 4 个 在 数值 上 是 非常 小 的 ， 但 是 第 5 个 样 
本 处 于 图 片 的 左上 角 ， 数 值 上 远 远 大 于 4 个 正常 值 。 而 构造 的 感知 器 网 络 需要 根据 期 望 响 
应 的 值 将 这 个 5 个 点 线性 地 划分 为 两 类 。 
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图 8-9 输入 向 量 与 期 望 响 应 样本 图 


合生 成 网 络 。 首 先 利用 newp 函数 构造 神经 网 络 。 为 了 包含 所 有 的 输入 样本 点 ， 设 
定 输入 样本 变化 范围 为 [-40 1;-1 50]， 生 成 网 络 为 1 层 。 生 成 网 络 之 后 ， 在 图 上 画 出 其 决策 
分 界线 。 输 入 如 下 MATLAB 命令 : 


net = newp([-40 1;-1 50],1)7 
hola on 
linehandle = plotpc(net.IW{1},nec.bf1l))7 


初始 生成 网 络 的 权 值 与 偏差 都 为 0， 分 界线 在 图 上 无 法 看 出 ， 因 此 无 法 进行 正确 的 分 
类 ， 需 要 对 其 进行 训练 。 

合 训练 网 络 。 利 用 adapt 函数 对 网 络 进行 训练 ， 此 处 将 每 次 adapt 函数 训练 过 程 迭 代 
次 数 定 为 3， 持续 到 误差 为 0 为 止 ， 这 是 通过 在 while 循环 条 件 内 利用 函数 sse 计算 误差 向 
量 的 平方 和 来 进行 控制 的 。 

训练 完成 后 ， 将 训练 后 的 网 络 决策 分 界线 绘 于 输入 /输出 向 量 图 上 ， 如 图 8-10 所 示 。 
输入 命令 ， 


E = 1; 
net .adaptParam.passes = 37 
while (sse(E)) 

[net,Y,E] = adapt(net,P,T) 1; 


linehandale = plotpc(net.INW{1},net.bf1),1inehandle); 
drawnowy 
end 
Vectorsto be Classied 
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人 图 8-10 训练 后 的 网 络 对 输入 样本 的 分 类 
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由 于 输入 样本 中 存在 一 个 非常 大 的 奇异 样本 , 这 大 大 地 增加 了 网 络 训练 的 时 间 。 不 过 ， 
尽管 花费 了 更 长 的 训练 时 间 ， 感 知 器 网 络 还 是 通过 学 习 对 输入 样本 实现 了 正确 的 分 类 。 

全 网 络 仿真 。 现 在 我 们 可 以 利用 sim 函数 来 进行 网 络 仿真 ， 通过 一 个 新 的 输入 向 量 
[0.7; 1.2] 来 检验 生成 网 络 的 性 能 。 

通过 hold on 命令 ， 保 持原 有 图 像 ， 在 其 上 增加 新 的 绘图 ， 在 新 增 绘图 完成 后 ， 通 过 
hold off 酸 放 图 像 资源 。 输 入 命令 : 

DpP= [0.7; 1.2]/ 

a = Sim(net,p); 

Plotpv(P,a) 7 

hold ony; 

Plotpv(P,T) 7 

plotpc(net.IW{1},net.bf1)); 

hold off; 

在 图 上 显示 出 对 新 输入 样本 的 划分 情况 ， 如 图 8-11 所 示 。 
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图 8-11 新 输入 样本 的 分 类 仿真 结果 
由 于 样本 点 太 小 ， 我 们 可 以 缩放 图 像 ， 便 于 查看 。 输 入 命令 
axis([-2 2 -2 2]); 


得 到 放大 后 的 图 像 ， 如 图 8-12 所 示 。 在 图 中 新 的 输入 样本 点 由 箭头 标 出 。 
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图 8-12 ”放大 后 的 分 类 结果 
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从 本 实例 中 看 到 ， 如 果 输 入 样本 中 存在 非常 大 的 奇异 样本 ， 在 花费 更 长 的 训练 时 间 的 
情况 下 ， 感 知 器 网 络 仍然 成 功 地 实现 了 对 输入 向 量 的 线性 分 类 。 对 于 这 种 情况 如 何 有 效 地 
减少 训练 时 间 ， 我 们 将 在 下 一 节 中 通过 实例 进行 介绍 。 


8.5.3 ”标准 化 感知 器 学 习 规则 实例 


【 例 8-8】 ”同样 对 【 例 8-7 】 中 包含 奇异 样本 的 二 维 输入 向 量 进 行 分 类 。 此 例 中 不 采 
用 原始 的 感知 器 学 习 规 则 ， 而 是 采用 标准 化 感知 器 学 习 规则 ， 应 用 leampn 函数 对 网 络 进 
行 训练 。 
解 ， 全 通过 下 列 语句 定义 输入 向 量 与 期 望 响应 ， 并 作 图 。 输 入 命令 : 

P =- [-0.5 -0.5 +0.3 -0.1 -40; 

-0.5 +0.5 -0.5 +1.0 50]; 

T-Ill001]; 

plotpv(P,T); 

全 生成 网 络 。 仍 然 利 用 newp 函数 生成 网 络 ， 但 这 回 我 们 不 采用 默认 的 学 习 规则 ， 
而 是 在 newp 函数 中 指定 学 习 规 则 为 learnpn， 即 标准 化 感知 器 学 习 规则 。 输 入 命令 ; 

net =- newp([-40 1;-1 50],1, hardlim'，'learnpn')7 


hola on 
linehandle = plotpc(net.IW{1}),nec.bf1)) 7 


侠 训练 网 络 。 对 网 络 进行 训练 ， 并 绘 出 训练 后 的 网 络 的 决策 分 界线 。 输 入 命令 ， 


已 = 1 
net .adapEParam.passes = 317 
while (sse(E)) 





[net,Y,E] = adapt(nect,P,T) 17 
linehandle = plotpc(tnet.IW(1} ,net.bf1),1linehandle)? 
Grawnowi 


end 


绘 出 图 形 如 图 8-13 所 示 。 
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图 8-13 训练 后 网 络 对 输入 样本 的 分 类 
输入 命令 axis 调整 坐标 轴 显 示范 围 ， 对 图 像 进行 放大 显示 ， 从 而 可 以 更 清楚 地 看 到 其 
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分 类 情况 。 
axis([-2 2 -2 2]); 
绘 出 图 形 如 图 8-14 所 示 。 
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图 8-14 ”放大 显示 的 样本 分 类 结果 


可 以 看 到 ， 相 对 于 利用 原始 学 习 规则 训练 得 到 的 感知 器 网 络 图 8-10 8-13 中 网 络 
的 决策 分 界线 发 生 了 变化 。 而 训练 过 程 的 执行 时 间 也 变 得 更 短 ， 这 是 因为 ， 标 准 化 感知 器 
学 习 算法 更 加 适用 于 输入 样本 变动 非常 大 的 场合 。 


8.5.4 ”线性 不 可 分 样本 问题 


感知 器 对 于 线性 可 分 样本 的 二 类 划分 是 非常 适用 的 ， 然 而 对 于 线性 不 可 分 的 输入 向 
量 ， 感 知 器 就 无 能 为 力 了 。 这 一 节 我 们 来 看 这 样 的 一 个 实例 ， 这 有 助 于 加 深 我 们 对 感知 器 
神经 网 络 的 局 限 性 的 理解 。 


【 例 8-9】 假定 二 维 输入 向 量 与 期 望 响应 为 已 = [ -0.5 -0.5 +0.3 -0.1 -0.8; -0.5 40.5 -0.5 
+1.0+0.0]; T=[11000]， 通 过 一 个 二 输入 的 感知 器 神经 网 络 对 其 进行 分 类 。 
解 : @ 定义 忆 、 蔗 后， 利用 plotpv 函数 对 输入 向 量 进行 图 形 显示 。 输 入 命令 ， 

P=[-0.5 -0.5 +0.3 -0.1 -0.8; 

-0.5 +0.5 -0.5 +1.0 +0.0 ]) 

中 二 0003 

plotpv(P,T) 

绘 出 图 形 如 图 8-15 所 示 。 

全 生成 网 络 。 对 于 上 面 的 输入 样本 ， 我 们 尝试 用 感知 器 神经 网 络 来 对 其 进行 划分 。 
首先 利用 newp 函数 生成 一 个 单 层 感知 器 网 络 ， 并 作 图 。 输 入 命令 : 

net = newp([-40 1;-1 50],1)， 

hold on 


Plotpv(P,T) 
1inehandle=plotpc (net.IW{1},net-bf1)}); 


由 于 生成 的 网 络 权 值 与 偏差 都 初始 化 为 0， 因 此 无 法 进行 分 类 ， 图 上 也 无 法 显示 决策 
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图 8-15 ”输入 向 量 与 期 望 响应 样本 图 


侠 训练 网 络 。 我 们 希望 能 够 通过 对 网 络 进行 训练 ， 使 得 网 络 能 够 对 输入 样本 进行 分 
类 。 因 此 利用 函数 adapt 进行 训练 ， 每 次 adapt 函数 执行 过 程 设置 3 次 迭代 ， 循 环 进行 25 
次 ， 然 后 在 图 上 画 出 训练 后 网 络 的 决策 分 界线 。 输入 命令 : 

net .adaptParam.passes = 317 

linehandle=plotpc(net.IW{1),net -pft1))7 

for a = 1:25 

[net,Y,E] = adapt (net,P,T); 
linehandle = plocpc(net.IW{1) ,net.b{1}),1inehandle); dGrawnow; 
endi 

绘 出 图 形 如 图 8-16 所 示 。 
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P) 
图 8-16 ”输入 向 量 与 期 望 响应 样本 图 


查看 误差 向 量 忆 的 值 ， 为 [1,1.0,0,-0]， 没 有 达到 0。 这 表明 ， 经 过 25 次 adapt 训练 后 ， 
网 络 仍然 不 能 将 输入 样本 正确 地 区 分 开 来 ， 这 一 点 从 图 中 的 决策 分 界线 也 可 以 看 出 来 。 

实际 上 ， 对 于 这 种 无 法 线性 划分 的 输入 样本 ， 感知 器 网 络 是 无 能 为 力 的 ， 这 也 是 单 层 
感知 器 神经 网 络 的 局 限 性 所 在 。 
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本 章 将 首先 介绍 感知 器 网 络 结构 以 及 其 学 习 算法 ， 然 后 介绍 如 何 利 用 MATLAB 神经 
网 络 工具 箱 函数 生成 、 仿 真 和 训练 一 个 感知 器 神经 网 络 ， 讨 论 单 层 感知 器 的 局 限 性 ， 最 后 
给 出 MATLAB 仿真 实例 作为 学 习 的 辅助 参考 。 
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本 章 所 要 介绍 的 线性 神经 网 络 与 感知 器 神经 网 络 在 网 络 结构 上 比较 相似 ， 也 是 最 简单 
的 神经 网 络 的 一 种 , 最 早期 的 代表 是 20 世纪 50 年 代 由 Widrow 和 Hoft 提出 的 自 适应 线性 
元 件 ( Adaptive Linear Element，Adaline )。 只 是 线性 神经 网 络 采 用 的 传递 函数 是 线性 函数 
而 不 是 硬 限 值 函数 。 这 使 得 网 络 的 输出 可 以 取 任 何 值 ， 而 不 是 像 感知 器 一 样 只 能 够 取 0 或 
者 1。 而 由 于 采用 了 线性 函数 作为 传递 函数 ， 线 性 神经 网 络 和 感知 器 网 络 一 样 ， 也 只 能 够 
适用 于 线性 分 类 问题 。 

线性 神经 网 络 的 设计 目标 ， 也 是 通过 对 输入 向 量 赋予 不 同 的 权 值 和 偏差 值 ， 对 于 给 定 
的 输入 产生 出 符合 期 望 的 网 络 响应 。 在 输出 向 量 和 目标 向 量 之 间 的 差 值 即 为 误差 。 通 党 
我 们 需要 寻找 的 是 这 样 一 组 权 值 和 偏差 ， 它 能 够 使 得 网 络 输出 相对 于 期 望 响 应 的 均 方 误差 
达到 最 小 。 

对 于 线性 系统 , 这 个 最 小 值 是 唯一 存在 的 ， 因此 这 个 问题 是 可 解 的 。 在 大 多 数 情况 下 ， 
我 们 可 以 直接 求解 出 一 个 线性 网 络 ， 使 得 对 于 特定 的 输入 向 量 和 期 望 响应 ， 其 输出 误差 达 
到 最 小 。 而 在 另 一 些 场合 ， 直 接 求解 可 能 会 有 些 难度 。 但 是 幸运 的 是 ， 我 们 总 是 可 以 通过 
由 Widrow 和 Hoff 提出 的 LMS 算法 ( Least Mean Squares ) 对 网 络 进行 训练 得 到 期 望 的 最 
小 均 方 误差 网 络 。 


线性 神经 网 络 结构 


线性 神经 网 络 虽 然 在 网 络 拓扑 结构 上 与 感知 器 网 络 相同 ， 但 是 它 以 连续 线性 模拟 量 为 
输入 ， 主 要 应 用 于 自 适应 系统 和 连续 可 调 过 程 。 本 节 我 们 将 对 线性 神经 元 和 网 络 结构 进行 
介绍 。 


9.1.1 ”线性 神经 元 模型 
9-1 给 出 了 一 个 线性 神经 元 的 模型 ， 该 神经 元 具有 R 个 输入 变量 Pi ， 对 输入 变量 赋 
以 不 同 的 权重 w 之 后 相 加 ， 并 加 入 偏差 5， 其 计算 公式 表示 为 : 


= 立 pnwut8 (9.1) 
i=1 
线性 神经 元 的 结构 与 我 们 在 上 一 章 介绍 的 感知 器 神经 元 的 结构 相同 ， 唯 一 不 同 的 是 线 
性 神经 元 是 采用 线性 ( purelin ) 函数 作为 网 络 传递 函数 ， 如 图 9-2 所 示 。 
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输入 线性 神经 元 





=purelin(Wp+D) a=purelin(m) 
图 9-1 ”线性 神经 元 模型 示意 图 图 9-2 ”线性 传递 函数 示意 图 
线性 传递 函数 直接 将 输入 的 值 作为 神经 元 的 输出 结果 ， 其 计算 公式 如 下 ; 
Q&=purelin(m) = purelin(Wp+b)=Wp+ 廊 (9.2) 


由 于 传递 函数 是 线性 的 ， 因 此 线性 神经 元 经 过 训练 可 以 拟 合 一 个 线性 函数 ， 或 者 求 得 
一 个 非 线性 函数 的 线性 逼近 ， 但 是 不 能 直接 应 用 于 非 线 性 的 计算 。 


9.1.2 ”线性 神经 网 络 结构 


一 个 普通 的 线性 神经 网 络 的 结构 如 图 9-3 所 示 , 其 中 左 图 是 分 解 形 式 表示 的 网 络 结 构 。 
可 以 看 到 ， 该 线性 神经 网 络 为 单 层 神经 元 结构 ， 共 包含 8 个 神经 元 ， 有 有 R 个 输入 ，w, 代 
表 第 ) 个 输入 对 第 个 神经 元 的 权 值 。 

图 9-3 的 右 图 是 以 矩阵 和 向 量 形式 表示 的 网 络 结 构 ， 输 入 向 量 为 Rxl 维 ， 权 值 和 矩阵 
厂 为 SxR 维 ， 偏 差 矢量 为 Sxl 维 ， 最 终 输 出 向 量 a 为 Sxl 维 。 


答 入 线性 神经 元 层 输入 线性 神经 元 层 
一 
已 可 
Rxl Sx1 
SxR 

Sx1 

1 
及 Sx1 8 

一 / 

a=purelin(Wy+b) 





=purelin(W+6) 


图 9-3 ”线性 神经 网 络 结构 示意 图 
尽管 上 图 表示 的 线性 神经 网 络 只 具有 单 层 网 络 结构 ， 但 是 实际 上 ， 它 与 复杂 的 多 层 神 
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经 网 络 结构 是 相同 的 。 可 以 证 明 ， 对 于 每 一 个 多 层 的 线性 神经 网 络 ， 都 能 够 找到 一 个 单 层 
的 神经 网 络 与 之 等 效 。 





_ 线 性 滤 波 器 


在 上 一 节 中 的 线性 神经 网 络 上 加 上 延迟 线 ， 就 可 以 构成 自 适 应 线性 滤波 器 ， 这 是 线性 
神经 网 络 的 一 个 非常 重要 的 应 用 。 作 为 线性 神经 网 络 的 提出 者 ，Widrow 对 这 一 网 络 的 应 
用 也 做 了 大 量 的 研究 工作 ， 先 后 将 其 应 用 于 天 气 预报 、 语 音 识别 和 图 像 分 析 等 多 种 领域 ， 
这 一 节 我 们 对 线性 滤波 器 进行 介绍 。 

我 们 将 为 线性 神经 网 络 引入 一 个 新 的 单元 -一 延迟 线 ( Tapped Delay Line )， 以 便 形成 
一 个 线性 滤波 器 。 假如 加 入 了 延迟 线 的 线性 神经 网 络 如 图 9-4 所 示 。 这 里 信号 从 左边 输入 ， 
经 过 N-1 个 单元 的 延迟 线 传输 ， 输 出 为 N-1 维 向 量 ， 形 成 当前 时 刻 的 神经 元 层 输入 信号 ， 
经 过 线性 层 后 获得 当前 的 滤波 器 输出 。 


ak) = purelin(Wp+ 芭 = > wua(k 一 i+D)+ 必 (9.3) 


绑 退 线 线性 层 





图 9-4 ”线性 滤波 器 结构 示意 图 


上 面 的 网 络 构成 了 数字 信号 处 理 领域 中 所 谓 的 有 限 冲击 响应 滤波 器 ( FIR filter )， 通过 
道 循 学 习 规则 的 训练 过 程 ， 就 可 以 获得 一 个 线性 自 适应 的 滤波 器 ， 加 入 训练 模块 的 自 适应 
线性 滤波 器 结构 如 图 9-5 所 示 。 在 后 面 我 们 将 会 进一步 介绍 。 


线性 神经 网 络 学 习 规则 


线性 神经 网 络 采用 Widrow-Hoff 提出 的 学 习 规则 ( W-H 学 习 规 则 } 来 修正 权 值 矢量 ， 
采用 W-H 学 习 规则 可 以 使 得 网 络 能 够 线性 各 近 一 个 函数 式 ， 从 而 进行 模式 联想 。 
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期 望 响应 
图 95 自 适应 线性 滤波 器 结构 示意 图 


9.3.1 均 方 误差 


与 感知 器 学 习 规 则 类 似 ，LMS 算法 同样 是 有 监督 学 习 的 一 种 。 学 习 规则 是 由 一 组 输入 
向 量 和 期 望 输出 给 出 的 ， 如 下 所 示 : 


{Pbtj,{Patzj fpoto} 


其 中 , 六 是 训练 时 提供 的 输入 向 量 ; ! 是 期 望 的 输出 向 量 。 将 实际 的 网 络 输出 与 期 望 输 
出 相 比较 ， 得 到 训练 的 均 方 误差 ， 用 公式 表达 如 下 


mue= 工 芝 c0Dz= 工 入 cb -ab)z (94) 
@ 刀 2 妃 


其 中 ，K(k) 是 上 时 刻 的 网 络 期 望 输出 ，a( 如 是 此 时 刻 对 应 的 实际 输出 。LMS 网 络 训练 
的 目标 是 使 得 上 述 均 方 误差 达到 最 小 。 

幸运 的 是 ， 线 性 神经 网 络 的 均 方 误差 性 能 指标 是 一 个 二 次 函数 ， 因 此 ， 此 均 方 误差 
性 能 指标 或 者 有 一 个 全 局 最 小 解 ， 或 者 有 一 个 局 部 最 小 解 ， 或 者 没有 最 小 解 ， 这 取决 
于 输入 向 量 的 特性 。 也 就 是 说 ， 输 入 向 量 的 性 质 决定 了 对 线性 网 络 进行 训练 的 解 是 否 
存在 。 


9.3.2 LMS 算法 


LMS 算法 又 称 为 Widrow-Hoff 学 习 规则 ， 是 基于 近似 最 陡 下 降 方法 的 学 习 规则 。 
Widrow 和 Hoff 发 现 ， 可 以 通过 计算 每 一 步 迁 代 过 程 中 的 方差 来 近似 得 到 均 方 误差 。 如 果 
将 第 上 次 迭代 的 方差 对 各 个 神经 元 的 权 值 和 偏差 求 偏 导数 ， 就 可 以 得 到 


aez(b) ae(b) 
二 一 =2e( 人 一， 了 =12,R (9.5) 
9wi amv 5 
aez( ae(b) 
二 2c(6Cec 9.6 
9b 2 9 ED 


下 面 我 们 将 偏差 的 表达 式 代入 ， 就 可 以 得 到 : 
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9edo _9e[t(O 一 ao _ 9E( 吕 一 (WPp(O+ 吕 ] 








3 3 E (9.7) 
-放风 
Dr wy 
其 中 ， 户 (b 是 第 上 次 迭代 时 的 输入 向 量 的 第 ;个 元 素 。 经 过 化 简 ， 可 以 得 到 ， 
3 -mt， 提 -=-1 (9.9) 
最 后 ， 得 到 权 值 和 偏差 矢量 的 改变 量 ， 分 别 为 
2awe(k)p(k) ，2we(e) (9.10) 
从 而 可 以 得 到 权 值 和 偏差 修改 的 方程 ， 即 Wildrow-Hoff 学 习 算法 ， 如 下 所 示 ， 
且 K+D= 且 (DO+2ae(DPTC (9.11) 
5(Kk+D=B(K)+2ae(k) (9.12) 


其 中 ， 偏 差 六 和 误差 e 都 以 向 量 的 形式 给 出 。 w 称 为 学 习 速 率 ， 如 果 w 比较 大 的 话 ， 
学 习 过 程 就 会 进行 得 相当 快 ， 但 是 如 果 学 习 过 程 过 快 ， 就 可 能 造成 求解 过 程 的 不 稳定 ， 反 
而 会 导致 误差 e 的 增加 。 

为 了 保证 学 习 过 程 的 稳定 性 ， 学 习 速率 通常 要 比 输入 向 量 的 自 相关 和 矩阵 pzp 的 最 大 本 
征 值 的 倒数 要 小 。 

MATLAB 工具 箱 也 提供 了 相应 的 函数 leamwh， 能 够 进行 相关 的 计算 。 此 函数 的 计算 
公式 表示 为 ， 


dw= 人 reP (9.13 ) 


业 = 和 人 re (9.14) 
其 中 ( 9.11 和 ( 9.12 ) 两 式 中 的 常数 2 被 规划 到 了 学 习 速率 区 中 去 了 。 
MATLAB 工具 箱 还 提供 了 另 一 个 函数 maxlinlr, 通过 计算 矩阵 0.999pTp 的 本 征 值得 到 
最 大 的 稳定 学 习 速率 。 


线性 神经 网 络 的 MATLAB 实现 


本 节 介绍 MATLAB 工具 箱 中 关于 线性 神经 网 络 的 函数 和 这 些 函数 的 应 用 。 


9.4.1 ”线性 神经 元 生成 
考虑 一 个 具有 两 个 输入 的 线性 神经 元 ， 其 结构 如 图 9-6 所 示 。 
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输入 线性 神经 元 
AN 
记 we 
me- 十 
\_/ 
a=purelin(Wp+b) 


图 9-6 ”二 输入 线性 神经 元 结构 示意 图 
由 于 整个 网 络 只 有 一 个 神经 元 ， 因 此 权 值 矩 阵 为 行 向 量 。 网 络 输出 表示 为 ， 
Qa=purelin(n)= purelin(WYp+ 世 =Wp+zb (9.15 ) 
或 者 
Q= WP +wi2p2 二 已 (9.16) 


如 同感 知 器 一 样 ， 线 性 神经 网 络 的 决策 边界 是 由 使 得 输出 为 0 的 输入 向 量 决定 的 。 即 
4 为 0 时 ， 由 Wp +=0 表示 的 直线 ， 如 图 9-7 所 示 。 





图 9.7 ”二 输入 线性 神经 元 决策 边界 线 


图 9-7 中 ， 处 于 右上 部 分 灰色 区 域 中 的 输入 向 量 通过 线性 网 络 后 产生 的 输出 结果 是 大 
于 0 的 ， 而 处 于 左下 部 分 白色 区 域内 的 输入 向 量 通过 线性 网 络 后 得 到 的 输出 结果 则 小 于 0。 

因此 ， 线 性 神经 网 络 也 可 以 用 来 对 输入 信号 进行 二 类 划分 ， 但 是 同样 只 有 在 输入 变量 
是 线性 可 分 的 情况 下 才 适 用 。 在 这 一 点 上 ， 线 性 神经 网 络 与 感知 器 神经 网 络 具有 同样 的 局 
限 性 。 

调用 函数 newlin 可 以 生成 一 个 线性 神经 元 ，newlin 函数 的 调用 格式 如 下 ， 

net= newlin(P,S, ID,LR) 

net = newlin(P,T,ID,LR) 
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在 第 一 种 格式 中 : 

e 忆 为 RxC 阶 和 矩阵， 代表 输入 向 量 的 取 值 范围 ，C 代表 输入 向 量 个 数 ; 

。3 为 输出 向 量 的 元 素 个 数 ， 

e ID 为 输入 延迟 向 量 ， 默 认 值 为 [0]， 没 有 延迟 ， 

。LR 代表 学 习 速 率 ， 默 认 值 为 001。 

而 在 第 二 种 格式 中 

。 了 为 SxO 阶 矩 阵 : 

。 3 为 输出 向 量 的 元 素 个 数 。 

函数 执行 的 返回 结果 是 一 个 线性 神经 元 对 象 。 

【 例 9-1】 ”线性 神经 元 生成 实例 。 本 例 生成 一 个 二 输入 的 线性 神经 元 并 仿真 。 
解 : 这 里 我 们 调用 newlin 函数 以 生成 线性 神经 元 ， 给 定 典 型 的 输入 向 量 为 [-1-1 和 [1,1]， 
以 及 典型 的 输出 向 量 为 [-1, 1]。 对 于 一 个 实际 问题 , 通常 输入 和 输出 使 用 的 都 是 实数 向 量 。 
输入 命令 ， 

net = newlin([-1 1; -1 1],[-1 1])7 

以 上 命令 执行 的 结果 是 生成 了 一 个 线性 神经 网 络 对 象 。 注 意 这 里 参数 中 给 定 的 所 谓 典 
型 的 输入 和 输出 向 量 并 不 是 直接 对 应 的 ， 而 是 一 个 量 级 上 的 概念 ， 便 于 生成 适当 的 网 络 权 
值 和 偏差 。 

默认 情况 下 ， 网 络 权 值 和 偏差 都 初始 化 为 0。 我 们 可 以 通过 下 面 的 语句 查看 当前 的 网 
络 权 值 和 偏差 。 输 入 命令 

由 = net.IW{1,11} 
得 到 

网 = 0 0 

输入 命令 ， 

b= net .bf1l)} 
得 到 : 


入:= 0 


我 们 也 可 以 对 权 值 和 偏差 典 予 我 们 期 望 的 值 ， 例 如 将 权 值 分 别 赋值 为 2 和 3。 输 入 命 





nec.IW{1,1) = [2 3]， 
W = net.IW{1,1} 


得 到 : 


W = 拓 3 


再 检查 偏差 的 值 。 输 入 命令 : 
net.bf1) = [-4]; 
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就 得 到 : 
= net.bf1)} 

b = ~ 名 

接 下 来 我 们 通过 给 定 的 输入 向 量 对 生成 的 网 络 进行 仿真 。 首 先 定义 输入 向 量 P。 输入 
命令 : 

DpP = [5;6]; 

再 利用 sim 函数 进行 网 络 仿真 。 输 入 命令 ， 

忌 = sim(net,p) 
得 到 网 络 仿真 结果 为 ， 

好 . 汪 24 


在 本 例 中 , 我 们 通过 工具 箱 提供 的 newlin 函数 建立 了 一 个 线性 神经 网 络 对 象 ， 并 调整 
了 内 部 参数 的 赋值 ， 应 用 sim 函数 进行 了 网 络 的 仿真 。 


9.4.2 ”线性 神经 网 络 生成 


线性 神经 网 络 与 其 他 种 类 较 复杂 的 网 络 不 同 的 是 ， 在 输入 和 输出 目标 向 量 已 知 的 情况 
下 ， 线 性 神经 网 络 可 以 通过 函数 直接 产生 。 利 用 函数 newlind， 我 们 可 以 设计 出 特定 的 网 
络 权 值 和 偏差 ， 以 达到 均 方 误差 最 小 化 的 目标 。 

newlind 函数 的 调用 格式 如 下 : 

net = newlind(P,T, Pi) 

其 中 ， 

。 己 为 RxO 阶 和 矩阵 ，@ 为 输入 向 量 个 数 ; 

。 了 为 SxO 阶 矩 阵 ，3S 为 输出 向 量 的 元 素 个 数 ， 输 出 向 量 个 数 也 为 2; 

* Pi 是 1xID 维 的 初始 输入 延迟 状态 。 

函数 执行 的 结果 是 返回 一 个 单 层 线性 神经 网 络 。 对 于 指定 的 输入 、 输出 向 量 已 与 T， 
此 线性 神经 网 络 具 有 最 小 的 均 方 误差 。 


【 例 9-2】 ”线性 神经 网 络 生成 实例 。 假 定 输入 向 量 和 目标 向 量 分 别 为 己 = [123]，7= 
[2.0 9.1 5.9]， 利 用 newlind 函数 设计 相应 的 线性 神经 网 络 对 象 。 
解 : 先 定义 输入 输出 向 量 ， 然 后 调用 newlind 函数 。 在 MATLAB 命令 行 输入 : 


Pa= ftl23]; 
T= [2.0 4.1 5.9]， 
net = newlind(P,T)， 


:这 样 我 们 得 到 了 一 个 线性 神经 网 络 对 象 。 通 过 sim 函数 对 其 进行 仿真 ， 输 入 命令 ; 
Y = sim(net,P) 


得 到 仿真 结果 
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Y= 2.0500 4.0000 5.9500 


我 们 发 现 ， 网 络 仿真 输出 结果 与 期 望 的 目标 响应 是 非常 接近 的 。 利 用 newlind 函数 也 , 
可 以 生成 带 有 延迟 线 的 线性 网 络 结 构 ， 这 将 在 下 一 节 中 介绍 。 


9.4.3 ”线性 滤波 器 生成 


对 于 有 延迟 线 的 线性 神经 网 络 ， 即 线性 滤波 器 ， 同 样 可 以 通过 newlind 函数 来 生成 ， 
下 面 举例 进行 介绍 。 

【 例 9-3】〗】 ”线性 滤波 器 生成 实例 1。 假定 网 络 输入 向 量 和 目标 向 量 分 别 为 已 = 
[1L2,1.3,3,21，T = [5,6,4,20,7.8]， 延 迟 状态 为 Pi = [1.3]， 利用 newlind 函数 生成 相应 的 线性 
滤波 器 网 络 。 

解 : 定义 输入 输出 向 量 。 在 命令 行 中 输入 : 


P=(l121332}; 
T=(t5642078); 


通过 下 面 的 语句 指定 网 络 输入 的 初始 延迟 : 

Pi = (13); 

此 延迟 设置 表示 神经 元 有 两 点 输入 ， 分 别 由 输入 向 量 经 过 1 个 单位 和 3 个 单位 的 延迟 
而 得 到 。 我们 可 以 利用 newlind 函数 来 生成 相应 的 线性 滤波 器 网 络 。 在 MATLAB 命令 行 中 
输入 命令 : 

net = newlind(P,T,Pi) 7 
即 生成 了 需要 的 线性 滤波 器 网 络 。 利 用 sim 函数 进行 网 络 输出 的 仿真 ; 

Y = sim(net,P, Pi) 
得 到 结果 为 : 

Y = [2.72971] [10.5405] (5.0090] [14.9550] [10.78381 [5.98201 

可 以 看 到 ， 仿 真得 到 的 网 络 响应 并 不 与 期 望 响应 完全 一 致 ， 但 是 相对 来 说 还 是 比较 接 
近 的 。 产 生 这 么 大 的 误差 的 原因 ， 是 因为 所 采用 的 延迟 线 太 短 ， 如 果 增 加 延迟 线 的 长 度 ， 
生成 的 线性 滤波 器 对 于 目标 响应 的 逼近 性 能 上 将 会 有 大 幅 的 提高 。 

不 管 怎样 ， 利 用 newlind 函数 生成 的 线性 滤波 器 网 络 保证 了 输出 相对 于 期 望 响应 的 均 
方 误差 最 小 化 。 





T1 = [5.0.6.1.4.0,6.0.6.9.8.01，T2 = [11.0,12.1.10.1.10.9,13.0,13.01; 并 且 初 始 延迟 状态 分 别 为 
Pil = [1.3.0]，Pi2 = [2,1.2]。 
解 : 人 @ 首先 定义 上 述 向 量 。 输 入 命令 : 


Pl=tl21332); Pil={l30)， 
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PE2={121121)7 Pi2={212); 
TL= (5.0 6.14.0 6.0 .6.9 8.0); 
T2 = {11.0 12.1 10.1 10.9 13.0 13.0}7 


然后 应 用 newlind 函数 生成 线性 滤波 器 网 络 。 输 入 命令 : 
net = newlind([P1; P2], [T1; T2],[Pil; Pi2]); 
全 利用 sim 函数 仿真 。 输 入 命令 : 

Y = sim(net, [P1; P2],[Pil;y Pi2]); 


利用 下 列 语句 查看 两 个 输出 的 最 终结 果 


YL = Y(1,:) 

Y2 = Y(2,，:) 

输出 结果 为 : 

YL1 = [5.0000] [6.10001 【4] [6] [6.9000)] [8.0000] 

Y2 = [11.0000] [12.1000] [10.1000] [10.9000] [13.0000] [13] 


在 此 例 中 我 们 看 到 ， 生 成 的 线性 滤波 器 网 络 能 够 很 好 的 符合 期 望 响应 。 与 【 例 9-3 】 
相 比较 ， 这 里 滤波 器 延迟 线 的 长 度 增加 1， 滤 波 器 的 性 能 得 到 了 很 大 的 提升 。 这 也 体现 了 
数字 信号 处 理 中 FIR 滤波 器 阶 数 对 性 能 的 影响 。 


9.4.4 “线性 神经 网 络 训练 


尽管 线性 神经 网 络 的 设计 可 以 直接 进行 ， 这 一 节 里 我 们 仍 将 通过 训练 的 方式 ， 使 得 一 
个 神经 元 对 于 给 定 的 输入 获得 指定 的 输出 。 

这 一 节 我 们 需要 用 到 的 新 的 MATLAB 工具 箱 函 数 包 括 errsurf\plotes、maxlinlr、plotep、 
plotperf。 首 先 我 们 对 这 些 相关 函数 的 调用 格式 进行 介绍 ， 再 通过 实例 进行 说 明 。 
1.， errsurf 

函数 errsurf 用 于 计算 一 个 单 输入 神经 元 的 误差 表面 矩阵 。 其 调用 格式 如 下 ， 

errsurf(P,T WV, BV, F) 

其 中 ， 

e 忆 为 1xC 阶 的 输入 向 量 ; 

。 了 为 1xC 阶 的 目标 输出 向 量 ; 

。 WYV 为 可 取 权 值 W 组 成 的 行 向 量 ; 

。 BYV 为 可 取 偏 差 妃 组 成 的 行 向 量 ; 

e 为 传递 函数 。 

函数 最 后 返回 一 个 由 WV 和 BYV 决定 的 误差 矩阵 。 


2. plotes 
函数 plotes 绘 出 一 个 单 输入 神经 元 的 误差 表面 。 其 调用 格式 如 下 : 
plotes(WV, BV, ES, 态 
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其 中 : 

e。 WV 为 可 取 的 权 值 多 组 成 的 行 向 量 ; 

se BYV 为 可 取 的 偏差 她 组 成 的 行 向 量 ; 

。ES 是 由 WV 和 BV 决定 的 误差 矩阵 ， 可 以 通过 上 面 的 errsurf 函数 计算 得 到 

。 是 三 维 图 采用 的 观察 角度 ， 默 认 的 观察 角度 为 [-37.5,.30]， 其 中 前 一 个 为 方位 角 ， 
后 一 个 数值 为 亿 仰 角 。 

函数 的 执行 结果 是 以 三 维 曲面 和 等 高 线 的 形式 ， 绘 制 出 神经 元 的 误差 表面 图 。 





3，maxlinir 


函数 maxlinlr 用 来 计算 线性 神经 元 层 的 最 大 学 习 速率 ， 其 调用 格式 如 下 

Ir= maxlinlr(P) 

Ir = maxlinlr(P bias) 

其 中 己 为 Rxg 阶 的 输入 向 量 矩 阵 。 
4. plotep 

函数 plotep 用 来 在 plotes 得 到 的 误差 曲面 和 等 高 线 图 上 绘 出 当前 网 络 的 误差 性 能 。 其 
调用 格式 如 下 ， 

及 = plotep(W, 甩 , 瑟 ) 

其 中 : 

e。 WW 为 当前 的 网 络 权 值 ; 

e。 甩 为 当前 的 偏差 向 量 ; 

。 巨 为 误差 矩阵 。 


5，plotperf 


函数 plotperf 用 来 显示 网 络 学 习 过 程 中 网 络 性 能 随 迭 代 次 数 的 变化 。 其 调用 格式 为 ， 
plotperf(TR, goal, name, epoch) 

其 中 : 

。TR 为 train 训练 函数 返回 的 训练 记录 对 象 ， 

e。 goal 是 训练 目标 值 ， 默 认 值 为 NaN; 

e name 是 网 络 函数 名 称 ， 默 认 值 为 

eepoch 为 目前 的 训练 的 迭代 次 数 。 

下 面 用 实例 进行 介绍 。 


【 例 9-5】 “线性 神经 网 络 训练 实例 。 给 定 一 维 输入 向 量 P= [6.0, -6.1 于 一 .0, +4.0， 
44.1 +6.0, +6.1]， 期 望 目标 输出 != [+0.0, +0.0, +.97, +.99, +.01, +.03,+1.0,+1.0]， 试 观 察 线 
性 神经 网 络 对 于 此 输入 和 目标 输出 的 误差 表面 ， 并 设计 一 个 网 络 对 象 进行 学 习 ， 观察 其 训 
练 情况 。 


解 ， 此 问题 用 单个 神经 元 就 可 以 完成 求解 。 
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全 首先 定义 输入 和 期 望 输出 。 输 入 : 


-6.0 -6.1 -4.1 -4.0 +4.0 +4.1 +6.0 +6.1]; 
+0.0 +0.0 +.97 +-99 +.01 +.03 +1.0 +1.0]; 


全 给 定 权 值 和 偏差 的 取 值 
wv = -1:.1:1; bv = -2.5:.25:2.5; 
然后 通过 errsurf 和 plotes 画 出 误差 曲面 ， 输 入 命令 : 


es = errSsurf(p,t,wv,bv,'1logsig') 7 
plotes (wv,bv,es,[60 30]); 


执行 结果 如 图 9-8 所 示 。 
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图 9-8 线性 网 络 误差 曲面 与 等 高 线 图 
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其 中 ， 左 图 是 以 三 维 图 的 格式 绘 出 的 误差 曲面 ， 右 图 是 以 等 高 线 的 格式 绘 出 的 误差 曲 
面 。 可 以 从 中 看 到 在 权 值 和 偏差 可 取 值 范围 之 内 ， 误 差 曲面 确实 包含 一 个 全 局 最 小 点 。 

人 @ 首先 计算 出 在 此 输入 向 量 下 能 够 得 到 的 线性 网 络 的 最 大 学 习 速 率 ， 然 后 定义 一 个 
网 络 对 象 ， 采 用 90% 的 最 大 速率 进行 学 习 ， 并 进行 观察 。 输 入 命令 : 


maxlr = 0.90*maxlinlr(p,'bias'); 


输出 结果 为 ， 


Imaxlr = 0.0042 


这 个 学 习 速 率 实际 上 是 比较 低 的 。 创 建 一 个 线性 网 络 对 象 ， 输 入 命令 : 


net = newlin([-2 2],1, [0] ,maxlr)7 


其 中 newlin 的 调用 格式 我 们 已 经 在 上 面 介 绍 过 。 在 此 例 中 ， 参 数 [-2, 2] 为 输入 的 取 值 
范围 ， 输 出 个 数 为 1， 网 络 没有 延迟 ， 采 用 的 最 大 学 习 速率 为 maxlr。 
鲜 下 面 修改 网 络 对 象 训练 的 属性 ， 将 训练 目标 值 设 定 为 0001。 输 入 : 
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met ,trainParam.goal = .001; 
应 用 train 函数 对 网 络 进行 训练 。 输 入 命令 : 
[net,tr] = train(nec,P,T) 7 


其 中 返回 值 net 是 每 一 步 训练 的 结果 ，tr 是 一 个 结构 体 ， 保 存 了 训练 过 程 的 信息 。 命 
令 执 行 的 时 候 ， 弹 出 了 训练 工具 窗口 ， 函 数 执行 结果 如 图 9-9 所 示 。 











和 sn -全 圳 
图 9-9 训练 工具 窗口 





随 着 训练 过 程 的 进行 ，epoch 进度 条 逐渐 增加 ， 显 示 迁 代 次 数 。 黑 认 的 最 大 迭代 次 数 
为 1000 次 。 此 例 中 可 以 看 到 ， 和 迭代 进行 了 364 次 ， 网 络 输出 才 达 到 设 定 的 训练 目标 值 ， 
即 均 方 误差 降 到 我 们 设 定 的 0.001 以 下 。 

对 此 我 们 可 以 理解 ， 对 于 比较 长 的 输入 、 输 出 向 量 ， 达 到 比较 小 的 误差 是 需要 一 定量 
的 迭代 次 数 的 。 

四 单 击 窗口 上 的 “Performance” 按 钮 ， 我 们 可 以 查看 均 方 误差 随 迭 代 次 数 的 变化 情 
况 ， 如 图 9-10 所 示 。 

图 中 实 线 是 训练 的 均 方 误差 值 ， 点 线 是 训练 目标 值 。 注 意 到 ， 左 边 的 坐标 值 采 用 的 是 
指数 刻度 。 从 图 中 可 以 看 到 ， 网 络 输出 的 均 方 误差 值 随 着 训练 的 进行 呈 指 数 下 降 ， 最 终 下 
降 到 0.001 所 用 的 和 迭代 次 数 为 364。 在 后 面 的 例子 中 我 们 将 会 看 到 ， 这 条 误差 性 能 线 也 可 
以 通过 函数 plotperf 得 到 。 

这 个 例子 中 ， 在 给 定 输入 向 量 和 期 望 输出 向 量 的 情况 下 ， 我 们 首先 查看 了 权 值 和 偏差 
取 值 范围 内 的 线性 网 络 的 误差 表面 情况 ,然后 在 给 定 的 最 大 学 习 速 率 下 , 利用 train 函数 完 
成 了 一 个 线性 网 络 的 训练 ， 并 且 观 察 了 训练 过 程 中 均 方 误 差 随 迭 代步 数 的 变化 ， 从 而 看 到 
了 Widrow-Hoff 学 习 规则 实际 应 用 的 情况 。 
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图 9-10 训练 中 均 方 误差 mse 随 迭 代 次 数 而 变化 


线性 网 络 的 局 限 性 


尽管 相对 于 感知 器 网 络 而 言 ， 线 性 网 络 的 取 值 区 间 不 再 只 是 二 值 范围 ， 但 是 线性 网 络 
仍然 只 能 够 表征 输入 与 输出 向 量 之 间 的 线性 关系 ， 因 此 对 于 一 些 问题 线性 神经 网 络 仍然 是 
无 法 求解 的 。 

不 过 ， 即 使 在 无 法 获得 精确 解 的 情况 下 ， 只 要 学 习 速 率 取得 足够 小 ， 线 性 网 络 仍然 能 
够 将 输出 的 均 方 误差 最 小 化 。 这 种 网 络 结构 能 够 找到 输入 与 输出 之 间 最 佳 的 近似 线性 各 
近 ， 具 有 这 种 性 质 是 因为 线性 网 络 的 误差 曲面 是 一 个 抛物 面 ， 因 为 抛物 面 总 是 只 有 一 个 最 
小 值 的 ， 因 此 利用 最 大 梯度 算法 ( 例如 LMS 算法 ) 总 能 够 得 到 最 小 值 解 。 

线性 网 络 还 有 其 他 的 一 些 限制 ， 例 如 对 超 定 系统 、 不 定 系统 、 线 性 相关 向 量 的 情况 ， 
这 一 节 将 对 这 些 内 容 加 以 介绍 。 


9.5.1 “ 非 线性 系统 


对 于 非 线性 系统 ， 线 性 神经 网 络 无 法 获得 精确 解 ， 只 能 够 得 到 其 线性 各 近 。 这 意味 着 
模型 的 偏差 会 带 来 比较 大 的 误差 。 下 面 以 实例 进行 说 明 。 

【 例 9-6】 。 非 线性 系统 神经 元 拟 合 实例 。 给 定 输入 向 量 和 期 望 输出 向 量 分 别 为 已 = 
[+1.0, +1.5, +3.0, -1.2],，T = [+0.5,+1.1, +3.0, -1.0]， 这 两 个 向 量 是 经 过 设计 , 无 法 用 WP+B = 了 
的 线性 关系 进行 表 出 的 。 接 下 来 利用 LMS 算法 训练 一 个 线性 神经 元 来 对 此 输入 和 输出 进 
行 拟 合 ， 看 看 会 得 到 什么 结果 。 

解 @@ 定义 输入 向 量 和 目标 输出 响应 。 输 入 命令 : 


P = [+1.0 +1.5 +3.0 -1.2]; 
m= [+0.5 +1.1 +3.0 -1.0]; 


食 通过 errsurf 和 plotes 画 出 误差 曲面 。 输 入 命令 ， 


w_Iange =-2:0.4:2; b_range = -2:0.4:2; 
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ES = errsurf{(P,T,w_range,b_range, "purelin') 1 
plotes (w_range,b_range,ES) ; 


命令 执行 结果 如 图 9-11 所 示 。 
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图 9-11， 非 线性 输入 输出 的 误差 曲面 与 等 高 线 图 
合计 算 线性 网 络 的 最 大 学 习 速率 ， 并 生成 线性 网 络 。 输 入 命令 ， 


maxlr = maxlinlr(P, bias') 7 

net = newlin([-2 2],1,[0],maxlr)7 

合 为 了 显示 出 训练 过 程 中 每 一 步 生成 的 网 络 的 误差 性 能 在 误差 曲面 上 的 变化 情况 ， 
我 们 每 次 运行 一 个 周期 就 调用 一 次 plotep 函数 在 误差 表面 上 绘 一 次 图 。 

由 于 newlin 生成 的 网 络 默认 的 最 大 训练 迁 代 次 数 设置 为 1000， 因 此 下 面 需要 设置 网 
络 最 大 训练 迁 代 次 数 为 1， 这 样 保证 训练 过 程 中 每 一 步 可 以 中 止 。 对 此 时 网 络 对 象 进行 给 
图 显示 。 输 入 命令 : 


net:train-param.epochs=17 


侠 完成 整个 训练 的 过 程 ， 并 绘图 。 各 个 点 之 间 用 蓝 线 连 接 起 来 ， 形 成 网 络 均 方 误差 
在 误差 性 能 面 上 运动 的 轨迹 。 输 入 命令 : 


hz=plotep(net .IW{1) ,net.bf1j,mse(T-sim(ner,P)))， % 绘 出 误差 性 能 起 点 
[net,tr] = train(net,P,T) 7 进行 单 步 训 练 
= trf s% 保 存 训 练 过 程 对 象 
epoch = 17 s% 设 定 变量 保存 训练 闪 代 步 数 
while epoch < 15 s# 开 始 循环 ， 最 大 迭代 次 数 为 15 
epoch = epoch+1; $ 迭 代步 数 加 1 
[net,tr] = train(net,P,T); & 训 练 


if length(tr.epoch) > 1 
h = plokep (ner.IW{1,1},net.bfl),tr.perf(2) ,bh) ;8 画 出 每 一 步 误差 性 能 点 
r.epoch=[r.epoch epoch]; % 将 训练 过 程 中 的 迭代 次 数 和 误差 保存 到 对 象 了 中 
r.perf=[r.perf cr.perf(2)]; 
r.vperf=[r.vperf NaN] 
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r.tperf=[r.tperf NaN]7 
else 
break 
engd 
enQ 


tr=r; # 最 后 一 步 重新 轩 值 ， 将 中 间 变量 r 的 值 赋 给 tr 
运行 上 面 代码 ， 作 出 图 像 ， 得 到 结果 如 图 9-12 所 示 。 
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图 9-12 训练 过 程 中 网 络 误差 性 能 的 变化 


可 以 看 到 ， 实 线 显示 了 整个 训练 过 程 中 误差 性 能 在 误差 表面 上 的 移动 情况 ， 最 终 完成 
15 次 迭代 之 后 ， 误 差 性 能 点 移动 到 了 白色 点 位 置 。 

人 @ 下 面 我 们 利用 函数 plotep 绘 出 误差 性 能 随 着 迭代 次 数 的 变化 情况 。 如 果 是 一 次 进 
行 多 步 迭 代 训练 的 话 ， 这 个 功能 也 可 以 如 上 例 通过 训练 工具 窗口 上 的 “Performance” 按 钮 
实现 ， 但 是 这 里 因为 采用 了 单 步 执 行 ， 因 此 需要 利用 下 面 命令 的 方式 实现 。 输 入 命令 ; 


PPlLotperf(tr,net.trainParam.goal); 


此 命令 绘 出 能 显示 误差 随 迭 代 次 数 的 变化 曲线 ， 以 及 训练 期 望 得 到 的 误差 性 能 目标 
线 ， 如 图 9-13 所 示 。 


图 9-13 ”误差 性 能 随 训 练 迭 代 次 数 而 变化 
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从 图 中 我 们 可 以 看 到 ， 训 练 结束 时 网 络 的 误差 性 能 值 为 0073。 对 预定 输入 进行 仿真 ， 
输入 命令 ， 

Ba = sim(net，P) 
得 到 网 络 输出 为 : 

忆 二 0.8500 1.3114 2.6958 -1.1803 


可 以 看 到 ,训练 后 的 网 络 响应 输出 值 a 与 期 望 响 应 了 = [+0.5, +1.1, +3.0， -1.0] 还 是 有 一 
定 的 差距 的 ， 这 是 用 线性 网 络 拟 合 具 有 非 线性 关系 的 输入 与 输出 所 带 来 的 误差 。 


9.5.2，” 超 定 系统 


考虑 这 样 一 种 情况 ， 假 定 线性 网 络 有 一 维 的 输入 向 量 和 目标 向 量 ， 但 是 每 一 个 输入 向 
量 和 目标 向 量 都 含有 四 个 元 素 ， 这 种 情况 下 方程 WP+B= 了 的 解 可 能 是 不 存在 的 ， 因 为 在 
这 个 问题 下 ， 存 在 四 个 约束 方程 ， 但 是 却 只 能 得 到 一 个 权 值 和 偏差 ， 对 于 这 种 问题 ， 我 们 
称 它 为 超 定 的 。 然 而 ， 尽 管 精 确 解 可 能 不 存在 ， 应 用 LMS 算法 仍然 能 够 使 得 均 方 误差 最 
小 化 ， 以 保证 获得 最 优 解 。 


9.5.3 ”不 定 系统 


对 于 不 定 情况 ， 可 以 考虑 一 个 单 输入 线性 神经 元 ， 仅仅 通过 两 个 一 维 的 输入 和 期 望 输 
出 向 量 对 其 进行 训练 ， 且 两 个 输出 均 只 包含 一 个 元 素 ， 例 如 已 = [1.0]，7 = [0.5]。 

这 种 情况 下 ， 由 于 只 有 一 个 约束 方程 ， 但 是 却 有 权 值 与 偏差 两 个 待定 变量 ， 待定 变量 
的 个 数 多 于 约束 方程 的 个 数 ， 这 会 导致 问题 具有 无 限 个 解 ， 也 就 是 所 谓 的 不 定 系统 问题 。 
下 面 举例 说 明 。 


【 例 9.7】 不 定 系 统 神经 元 拟 合 实例 。 给 定 输入 向 量 和 期 望 输出 向 量 分 别 为 忆 = [+1.0]， 
了 = [+0.5]， 我 们 知道 此 线性 问题 的 对 应 解 的 个 数 为 无 限 个 ， 利 用 LMS 算法 训练 一 个 线性 
神经 网 络 来 对 此 输入 和 输出 进行 拟 合 。 

解 : 图 首先 定义 输入 和 输出 向 量 。 输 入 命令 ; 


了 
了 


国 利用 errsurf 与 plotes 函数 观察 其 此 问题 下 的 误差 性 能 表面 。 输入 命令 ， 


w_range = -1:0.2:1; 
b_range = -1:0.2:17 

ES -= errsurf(P,T,w_range,b_range，purelin' ) 7 
plotes (w_range,b_range,ES) 


得 到 的 误差 性 能 表面 如 图 9-14 所 示 。 
全 计算 网 络 的 最 大 学 习 速率 ， 并 生成 初始 线性 网 络 。 输入 命令 : 


maxlr = maxlinlr(P，bias') 7 





[+1.0]7 
【+0.5]7 
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net = newlin([-2 2],1, [0] ,maxlr); 


Emor Surace Emor contour 


BasB 
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图 9-14 ”不 定 问题 的 误差 曲面 与 等 高 线 图 


图 设 定 网 络 的 训练 目标 为 le-10。 要 注意 ， 这 是 一 个 非常 小 的 数 ， 相 对 来 说 ， 精 度 要 
求 是 非常 高 的 。 输 入 命令 ， 


net .rainParam.goal = le-10); 


加 同上 例 ， 我 们 设 定单 次 训练 的 迭代 次 数 为 1， 然后 逐次 画 出 误差 性 能 表面 上 点 的 
移动 情况 。 这 里 我 们 的 循环 过 程 没有 设 定 最 大 值 ， 这 样 的 结果 是 ， 和 迭代 会 一 直 进行 下 去 ， 
一 直到 网 络 训练 达到 目标 为 止 。 输 入 命令 如 下 : 





net .trainParam.epochs = 1; % 设 定单 次 训练 的 迭代 次 数 为 1 
h=plotep (net.IW{1),net.bf1}j,mse(T-sim(net,P))); # 绽 出 误差 性 能 起 点 
[net,trj = train(net,P,T); 
= zy % 保 存 训练 过 程 对象 
epoch = 1; 
while true % 和 迭代 过 程 一 直 持续 ， 直 到 满足 训练 目标 为 止 

epoch = epoch+1; 

[net,tr] = train(net,P,T); 


if length(tr.epoch) > 1 
h = plotep(net.IW{1,1},net.bf{1),tr.perf(2),h) ;ss 画 出 每 步 的 误差 性 能 点 
break 
ena 
ena 


tr=r; % 最 后 一 步 重新 赋值 ， 将 中 间 变 量 的 值 赋 给 tr 


运行 上 面 代码 之 后 ， 曲 面 上 绘 出 了 每 一 步 的 误差 性 能 点 ， 如 图 9-15 所 示 。 我 们 看 到 ， 
仅仅 进行 了 一 次 迭代 就 退出 了 循环 。 
侠 作出 误差 性 能 随 迭 代 次 数 的 变化 图 。 输 入 命令 : 


PLotperf (tr,net.trainParam.goal); 
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图 9-15 训练 中 网 络 的 误差 性 能 点 在 误差 性 能 曲面 的 移动 

















图 9-16 训练 中 网 络 的 误差 性 能 随 迭 代 次 数 的 变化 


可 以 清楚 地 看 到 ， 迭 代 仅 仅 进 行 了 一 步 ， 误 差 性 能 就 立刻 达到 了 le-10 以 下 。 对 于 这 
么 高 的 精度 目标 ， 一 步 迭 代 就 能 达到 ， 这 就 是 由 于 不 定 问题 有 无 限 多 个 精确 解 造成 的 ， 因 
此 在 误差 性 能 表面 上 ， 很 容易 就 能 够 找到 适应 于 此 问题 的 解 。 

同样 我 们 可 以 对 生成 的 网 络 进行 仿真 。 输 入 下 列 语 句 : 


a = sim(net,P); 
得 到 
a = 0.5000 
可 以 看 到 ， 此 训练 生成 的 网 络 能 够 得 到 精确 的 期 望 响应 。 
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全 为 了 进行 对 比 ， 我 们 可 以 用 另 一 种 方法 来 生成 一 个 线性 网 络 ， 比 较 一 下 这 两 种 方 
法 的 解 。 

前 面 介绍 过 ， 对 于 给 定 的 输入 向 量 和 期 望 输出 向 量 ， 利 用 工具 箱 中 的 函数 newlind 可 
以 直接 生成 适应 于 此 问题 的 线性 网 络 。 下 面 我 们 利用 这 个 函数 生成 一 个 网 络 ， 然 后 将 其 与 
上 面 训练 产生 的 网 络 进行 比较 。 

首先 关闭 图 9-16 绘图 窗口 ， 然 后 输入 命令 : 

solvednet = newlind(P,T);  #% 用 newlind 直接 求解 产生 一 个 新 的 网 络 

hold ony s# 保 持 打开 的 4-15 绘图 窗口 

Ploet (solvednet .IW{1,1},solvednec.bf1}j,'ro') % 在 原 图 上 用 红 点 标 出 此 网 络 性 能 点 

hold off; 


执行 上 述 命令 得 到 的 图 形 如 图 9-17 所 示 。 
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图 9-17 用 newlind 产生 的 网 络 与 训练 产生 的 网 络 比较 


图 中 新 生成 的 网 络 性 能 点 用 圆圈 表 出 。 可 以 看 到 ， 它 与 训练 产生 的 网 络 权 值 和 偏差 都 
不 相同 ， 然 而 这 两 组 网 络 都 是 此 问题 的 精确 解 。 也 就 是 说 ， 适 合 此 问题 的 解 是 不 唯一 的 ， 
这 就 是 方程 组 不 定 造成 的 结果 。 


9.5.4 ”线性 相关 向 量 


通常 确定 一 个 线性 网 络 是 否 适 合 于 求解 待定 问题 的 方法 很 简单 。 设 神经 网 络 输入 为 S 
个 ， 每 个 输入 为 R 元 向 量 ， 则 其 对 应 线性 方程 的 自由 度数 目 为 S*R+S， 也 就 是 网 络 的 待定 
权 值 和 偏差 的 个 数 ， 而 约束 方程 的 个 数 为 2， 这 是 由 输入 向 量 和 输出 向 量 的 元 素 个 数 决定 
的 ， 如 果 S*R+S = @C 的 话 ， 就 可 以 求 得 精确 解 。 

然而 ， 如 果 没有 误差 的 输入 向 量 之 间 存 在 线性 相关 性 的 话 ， 约 束 方程 的 个 数 将 小 于 自 
由 度 的 个 数 ， 从 而 导致 方程 无 法 求 得 符合 条 件 的 精确 解 。 


【 例 9-8】 线性 相关 向 量 拟 合 实例 。 给 定 输入 向 量 和 期 望 输出 向 量 分 别 为 忆 = [1.0, 2.0， 
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3.0;4.0,5.0,60],，T= [0.5,10,-1.0]， 训 练 一 个 二 输入 线性 神经 网 络 来 对 此 其 进行 拟 合 。 
解 ， 人 @@ 首先 定义 输入 和 输出 向 量 。 输 入 命令 : 
PP=[1.0 2.0 3.07 


4.0 5.0 6.0]7 
?= [0.5 1.0 -1.0]; 





放 对 于 疡 第 三 列 输入 向 量 从 好 是 第 二 列 与 第 三 列 输入 向 量 之 和 的 112， 这 表示 
输入 向 时 是 政 性 相关 的 ， 纹 而 对 于 允 ， 列 向 量 之 间 并 没有 同样 的 线性 关系 。 这 
祥 的 结果 会 导致 眶 性 神经 元 找 不 到 合适 的 解 。 


全 计算 对 于 此 输入 向 量 网 络 可 具有 的 最 大 学 习 速率 ， 并 生成 初始 线性 网 络 。 输入 如 
下 命令 ， 


maxlr = maxlinlr(P，bias') 7 
net = newlin([0 10;0 10],1, [0],maxlr)7 


其 中 ，newlin 函数 的 参数 ， 两 个 输入 的 最 小 和 最 大 值 都 设 定 为 [0 10]， 输出 个 数 设 定 
为 1， 输 入 延迟 为 0。 

侠 对 网 络 进行 训练 , 设 定 最 大 训练 欠 代 次 数 为 500， 目标 均 方 误 差 为 0.001, 利用 train 
函数 对 网 络 进行 训练 ， 默 认 的 网 络 学 习 规 则 为 Widrow-Hoff 规则 。 输入 命令 

net .trainparam.epochs = 500; *# 最 大 和 迭代 次 数 . 

net ,trainParam.goal = 0.001; s 误差 性 能 目标 

fnet,tr] = train(net,P,T) 1 

从 弹出 nntraintool 窗口 中 我 们 看 到 ， 训 练 完成 了 全 部 500 次 迭代 。 单 击 弹出 窗口 上 的 
“Performance” 按 钮 ， 会 得 到 网 络 误差 性 能 随 迭 代 次 数 变化 的 曲线 ， 如 图 9-18 所 示 。 
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图 9-18 “网络 误差 性 能 随 迭 代 次 数 而 变化 


从 图 9-18 中 可 以 明显 地 看 到 ， 经 过 500 次 迭代， 网 络 误差 性 能 仍然 在 0.1 以 上 , 远 没 
有 达到 期 望 的 0.001 的 水 平 。 这 是 因为 输入 向 量 线性 相关 ， 而 期 望 响应 并 不 具有 相同 的 线 
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性 关系 。 
钨 下 面 测试 训练 后 的 网 络 对 第 一 个 输入 [1:4] 的 响应 。 输 入 命令 . 
PpP= [1.0; 4]7 
aa = sim(net,p)》 
得 到 输出 结果 为 : 


a = 0.8971 
与 期 望 的 T(D = 0.5 相差 很 远 ， 也 说 明 网 络 确实 没有 达到 我 们 的 期 望 。 


9.5.5 “学 习 速 率 过 大 


我 们 前 面 介 绍 过 ， 对 于 线性 神经 网 络 ， 总 可 以 通过 Widrow-Hoff 的 LMS 学 习 算法 找 
出 权 值 和 偏差 的 最 小 均 方 误差 解 ， 但 前 提 是 学 习 速 率 足够 小 。 

当 学 习 速 率 过 大 时 ， 大 到 超过 maxlinlr 求 出 的 最 大 学 习 速率 的 时 候 ， 可 能 会 导致 闪 代 
过 程 中 均 方 误 差 反常 增 大 ， 这 会 导致 网 络 学 习 时 间 增加 ， 或 者 会 无 法 收敛 到 最 小 均 方 误 差 
解 。 下 面 对 此 用 实例 说 明 。 


【 例 9-9】 学 习 速 率 的 影响 实例 。 按 下 面 给 定 的 输入 向 量 和 期 望 响 应 ， 用 大 于 maxlnlr 
结果 的 学 习 速率 对 网 络 进行 训练 ， 检 查 网 络 训练 的 结果 。 
解 ， (GD) 定义 输入 和 输出 向 量 。 输 入 命令 : 


P= [+1.0 -1.2]; 


IT= [+0.5 +1.0]7 


@@ 观察 此 输入 和 输出 向 量 的 误差 曲面 。 输 入 命令 ， 





plotes (w_range,b_range,ES) ; 


作出 的 误差 曲面 图 如 图 9-19 所 示 。 






图 9-19 误差 曲面 与 等 高 线 图 
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合 计算 最 大 学 习 速 率 ， 并 生成 初始 线性 网 络 ， 这 里 网 络 采用 的 学 习 速率 为 maxlr 的 
2.25 倍 。 输 入 命令 : 


maxlr = maxlinlr(P，'bias') 7 
net = newlin([-2 2],1, [0],maxlr*2.25)7 


合 对 网 络 进行 训练 ， 设 定 最 大 训练 迁 代 次 数 为 20， 利 用 train 函数 对 网 络 进行 训练 ， 
此 处 对 训练 中 网 络 的 误差 点 在 曲面 上 的 移动 轨迹 进行 显示 。 与 【 例 9-6 】 相同 ， 将 训练 设 
置 为 单 步 执 行 。 输 入 命令 : 


net .ErainParam.epochs = 1; 
net .trainParam.show = NaN1; 
h=plotep (net .IW{1} ,ner.bfi),mse(T-sim(ner,P)))7 
[net,tr] = train(net,P,T) 7 
z = tri 
epoch = 1 
while epoch < 20 
epoch = epoch+l7 
[net,tr] = train(nec,B,T) 7 
if length(tr.epoch) > 1 
h = plotep (net.IW{(1,1},nec.bft1l),cr.perf(2) hl7 
r.epoch= [r.epoch epoch]; 
r.perf=[r.perf tr.perf(2)]7 
r.vperf=[r.vperf NaN] 1? 
.tperf=[r.cperf NaN]1 
else 
break 
end 
end 
trsrf 


得 到 的 误差 点 在 曲面 的 移动 轨迹 如 图 9-20 所 示 。 









图 9-20 ”误差 性 能 点 的 移动 情况 
可 以 看 到 ， 误 差 性 能 点 并 未 移动 到 期 望 的 误差 曲面 最 低 点 。 
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全 下 面 作出 误差 性 能 随 迭 代 次 数 的 变化 图 。 输 入 命令 ， 


plotperf (tr,net.trainParam.goal) 1; 
绘 出 图 形 如 图 9-21 所 示 。 
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图 9-21 误差 性 能 随 迭 代 次 数 而 变化 


可 以 看 到 ， 随 着 训练 的 进行 ， 网 络 的 误差 性 能 非但 没有 减 小 ， 反 而 增 大 了 ， 这 就 是 训 
练 速率 过 大 造成 的 后 果 。 





线性 神经 网 络 可 以 应 用 于 系统 辨识 、 信 号 预测 、 自 适应 滤波 和 控制 等 诸多 方面 。 这 - 
节 我 们 将 对 其 应 用 实例 进行 介绍 。 


9.6.1 “线性 预测 


【 例 9-10〗 ”线性 神经 网 络 预测 实例 。 假 设 输入 信号 为 采样 间隔 为 0.01s， 持续 时 间 
2s 的 正弦 信号 ， 试 构建 合适 的 线性 神经 网 络 ， 通过 某 一 时 刻 的 前 6 个 输入 信号 采样 值 预测 
下 一 个 信号 的 值 。 

解 ， (人 定义 采样 时 间 序 列 和 目标 信号 ， 以 及 信号 长 度 。 输 入 命令 : 

Time = 0:0.01:2; 

T = sin(Timex8vpi)， 

Length = length(T); 

输入 下 面 的 命令 ， 作 出 信号 曲线 

plot (Time，T) 

xlabel(' 时 间 ' ) ; 

Y1label ( ' 目 标 信号 ') ; 


得 到 目标 信号 波形 如 图 9-22 所 示 。 
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图 9.22 ”目标 信号 


人 @)》 我 们 采用 的 线性 网 络 具有 6 个 输入 ，1 个 输出 ， 输 入 向 量 分 别 是 了 延迟 1、2、3、 
4、5、6 个 采样 点 得 到 的 结果 。 定 义 如 下 : 

P=zeros(6,Length) ; 

for i=1:6 

P(i,i+l:Length)=T(1:Length-i)7 

ena 
得 到 输入 向 量 矩 阵 己 的 定义 。 

全 下 面 直接 利用 newlind 函数 来 设计 户 ，T 所 对 应 的 网 络 。 输 入 命令 ， 


net = newlinG(P,T) 7 
全 接 下 来 利用 sim 函数 仿真 ， 测 试 其 网 络 性 能 。 输 入 命令 : 


a = sim(net,P) 1 
plot (Time ,az')i 
xlabel{(' 时 间 '); 
ylabel (' 预 测 输出 ' ) 


得 到 网 络 的 预测 输出 图 如 图 9-23 所 示 。 
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图 9-23 ”网 络 的 预测 输出 
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鲜 下 面 作 出 误差 图 。 输 入 如 下 命 











e=T-ar 
figure， 
plot (Time,e) 
xlabel (' 时 间 ') ; 
Y1label ( ' 预 测 误差 ') ; 
得 到 的 误差 曲线 如 图 9-24 所 示 。 
03 
aas 
oa | 
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om 
os 
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图 9-24 ”网络 的 预测 误差 曲线 


从 图 中 可 以 看 到 ， 仅 仅 在 刚 开始 的 很 短 的 时 间 内 ， 网 络 的 预测 误差 比较 大 ， 经 过 训练 
预测 误差 很 快 降 到 接近 0 值 ， 网 络 实现 了 对 目标 进行 预测 的 功能 。 

在 非 线性 问题 的 预测 中 ， 线 性 网 络 也 能 够 给 出 最 小 的 线性 预测 误差 ， 给 出 问题 的 最 佳 
线性 盟 近 。 


9.6.2 ” 自 适应 滤波 噪声 抵消 


【 例 9-11】〗 线性 神经 网 络 自 适应 滤波 实例 。 本 例 我 们 利用 线性 网 络 adapt 函数 来 对 输 
入 信号 进行 自 适应 滤波 ， 获 得 期 望 的 输出 响应 。 
解 : @@ 设 定 输入 信号 与 期 望 输出 T， 采 样 率 为 100Hz， 持 续 采样 2.5s。 输 入 如 下 命令 ; 
time = 1:0.01:2.57 
X = sin(sin(time) .*timex10) 1 


P = con2seq(X); 
T = con2seq(2*[0 X(1:(end-1))] + X); 


其 中 con2seq 函数 的 作用 是 将 输入 序列 转化 为 adapt 函数 所 需要 的 序列 信号 格式 。 
全 作出 输入 向 量 和 期 望 响应 图 。 输 入 如 下 命令 : 

plot (time,cat(2,P{:}) ,time,cat(2,T{:})，--) 
title(' 输 入 信号 与 期 望 响应 ' ) 

xlabel(' 时 间 ') 

legenda({ ' 输 入 ' ，' 期 望 响应 ) 


和 
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得 到 的 图 形 如 图 9-25 所 示 。 
输入 信号 与 期 望 响应 




















时 间 
图 9-25 ”输入 信号 与 期 望 响应 图 


侠 利用 newlin 函数 生成 线性 网 络 。 设 定 网 络 输入 最 小 和 最 大 值 分 别 为 -3 和 3， 包含 
一 个 神经 元 ， 网 络 输入 首先 通过 延迟 线 ， 延 迟 参数 设 定 为 [0 1]， 表示 由 两 个 值 进 行 加 权 ， 
这 两 个 进行 加 权 运算 的 值 分 别 是 当前 输入 信号 和 延迟 1 个 采样 间隔 的 结果 。 输入 命令 : 


net = newlin([-3 3],1,[0 1],0.1)， 


合 利用 adapt 函数 对 输入 信号 进行 自 适应 滤波 ，adapt 函数 需要 的 参数 是 转化 为 序列 
信号 格式 的 PP，7 向 量 ， 然 后 将 网 络 自 适应 滤波 的 输出 、 期 望 响应 、 以 及 误差 画 在 图 上 。 


输入 命令 如 下 
[net,Y,E,Pf]=adapt (net,P,T) 7 
figure， 
plot (time,cat(2,Y(:])，b'， 
time,cat(2,T{:))， 
[1 2.51, [0 0]，k') 


上 time,cat(2,E{:})，+ 
legend{{ ' 输 出 '，' 期 望 响应 ' ,误差 ')) 








结果 如 图 9-26 所 示 。 




















遇 15 


图 9-26 输入、 期望 响应 以 及 误差 图 
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在 图 9-26 中 网 络 的 实际 输出 用 曲线 表示 ,而 期 望 响应 用 圆 点 表示 ,误差 曲线 用 加 号 "4 
表示 。 可 以 看 到 ， 线 性 网 络 可 以 很 好 地 实现 对 网 络 输出 的 线性 逼近 ， 最 终 学 习 的 结果 是 使 
得 均 方 误差 值 达到 最 小 。 

在 自 适应 学 习 进行 到 2s 时 ， 网 络 已 经 能 够 几乎 无 误差 地 逼近 期 望 的 目标 响应 ， 误 差 
降低 到 接近 0 的 水 平 。 


9.6.3 ” 自 适应 滤波 系统 辨识 


【 例 9-12】 ”线性 神经 网 络 自 适应 系统 辨识 实例 。 本 例 中 我 们 设计 一 个 线性 网 络 ， 该 
网 络 能 够 随 着 被 辨识 的 模型 的 变化 而 变化 ， 从 而 对 实现 对 一 个 线性 系统 的 自 适 应 辨识 。 
解 ，(@ 设 定 输入 信号 持续 时 间 为 gs， 采样 率 为 200Hz。 输 入 如 下 命令 ， 

timel = 0:0.005:3; 

time2 = 3.005:0.005:6; 

time = [timel time2]; 

P = sin(sin(times4) .*timewB) 1) 


在 图 上 绘 出 输入 信号 的 曲线 。 输 入 命令 : 


Plot (time,P) 
xlabel(' 时 间 ') ; 
Ylabel(' 输 入 信号 ') ; 


结果 如 图 9-27 所 示 。 





征 入 信和 号 




















图 9-27 输入 信号 曲线 图 


加 设 定 系统 的 期 望 响应 为 7， 对 于 前 3s 和 后 38， 响 应 方式 是 不 一 样 的 。 输 入 如 下 命 


stepslI=length(timel); 
Steps2=length(time2); 

[T1, state]=filter([1 -0.5],1， P(1:stepsl)); 
T2=filter([0.9 -0.6],1,P(1+stepsl:steps2+stepsl) ,state); 
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Te=[T1 T2] 


在 图 上 绘 出 期 望 输出 曲线 图 。 输 入 命令 : 


figure， 

plot (time,T) 
xlabel(' 时 间 ') ， 
ylabel (' 输 出 信号 ') ; 


输出 结果 如 图 9-28 所 示 。 
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图 9-28 ”期 望 输出 信号 曲线 图 
合 采用 输入 信号 己 在 当前 时 刻 和 上 一 个 采样 时 刻 的 值 作为 滤波 器 输入 ， 利 用 这 两 点 
来 估计 输入 信号 的 值 。 同 样 利用 adapt 函数 进行 自 适应 滤波 。 输 入 命令 ; 


T=con2seq(T) ; 
P=con2seq(P) ; % 将 输入 和 输出 向 量 转 成 aaapt 需要 的 序列 信号 格式 


利用 newlin 函数 建立 网 络 ， 网 络 输入 的 取 值 范围 由 输入 信号 忆 的 最 小 和 最 大 值 确定 ， 
两 点 延迟 滤波 ， 最 大 学 习 速率 为 0.5。 输 入 命令 ， 
net = newlin(minmax(cat(2,P{:}))，1, [0 1],0.5)); 
合 利用 adapt 函数 进行 训练 ， 得 到 网 络 的 权 值 和 阔 值 。 输 入 如 下 命令 : 
[net,a,e]=adapt (net，P，T) 7 
绘 出 网 络 自 适应 滤波 的 输出 与 期 望 响 应 。 输 入 命令 : 


figurey 
plot(time，cat(2,at:))，'b'，time，cat(2,T{:))， 0) 
xlabel(' 时 间 ') ; 

legend({ ' 输 出 ' 期 望 响应 ' )) 7 


得 到 绘图 结果 如 图 9-29 所 示 。 
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时 间 
图 9.29 ”实际 输出 与 期 望 响应 信号 曲线 图 
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图 中 曲线 连接 为 实际 输入 信号 ， 圆 点 为 期 望 响应 信号 ， 由 于 信号 比较 复杂 ， 因 此 仍 不 


清楚 。 下 面 画 出 误差 曲线 。 输 入 命令 : 


figure， 
PlLot(time,cat(2,ef:})) 7 
xlabel(' 时 间 ') ; 
Ylabel{' 误 差 ') 


得 到 的 误差 曲线 结果 如 图 9-30 所 示 。 


025 -~ 一 
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图 9-30 ”误差 曲线 图 


可 以 看 到 ， 自 适应 线性 滤波 经 过 2.5s 的 学 习 ， 然 后 变 得 比较 精确 了 ， 由 于 在 第 3 秒 的 
时 候 系统 期 望 响应 发 生 了 变化 ,网络 又 用 了 大 约 0.5s 的 时 间 来 学 习 与 跟踪 模型 ， 从 而 实现 


了 系统 辨识 的 功能 。 


非 线 性 系统 处 于 某 一 个 工作 状态 时 ， 自 适应 线性 系统 能 够 很 好 地 逼 近 非 线性 系统 的 状 
态 ， 而 一 旦 非 线性 系统 发 生 了 突变 ， 自 适应 系统 又 能 够 很 快 地 跟踪 系统 的 变化 状况 ， 通 过 
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一 定时 间 的 学 习 训练 ， 重 新 建立 起 稳定 的 运行 点 ， 实 现 对 系统 的 高 精度 逼近 。 


小 结 


本 章 主要 介绍 了 线性 网 络 以 及 与 之 相关 的 工具 箱 函数 newlin、newlind， 讲 解 了 如 何 针 
对 一 般 的 目的 或 特定 的 目的 设计 合适 的 线性 神经 网 络 ， 同 时 介绍 与 线性 神经 网 络 密切 相关 
的 线性 自 适应 滤波 器 的 应 用 。 
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20 世纪 80 年 代 ，David Rumelhart、 Geoffrey Hinton 以 及 Williams 分 别 独 立地 给 出 BP 
算法 的 清楚 的 表述 ， 解 决 了 多 层 神经 网 络 的 学 习 问题 ， 实 现 了 多 层 网 络 的 设想 。 这 重新 激 
起 了 人 们 因 Minsky 等 人 对 单 层 感知 器 局 限 性 的 判定 而 失去 的 信心 , BP 算法 的 出 现 极 大 地 
促进 了 神经 网 络 的 发 展 。 

BP 神经 网 络 又 称 为 误差 反 向 传播 ( Back Propagation ) 神经 网 络 ， 它 是 一 种 多 层 的 前 
向 型 神经 网 络 。 在 BP 网 络 中 ， 信 号 是 前 向 传播 的 ， 而 误差 是 反 向 传播 的 。BP 网 络 通常 具 
有 一 个 或 多 个 sigmoid 隐 层 和 线性 输出 层 ， 能 够 对 具有 有 限 个 不 连续 点 的 函数 进行 逼近 。 

所 谓 的 反 向 传播 是 指 误差 的 调整 过 程 是 从 最 后 的 输出 层 依次 向 之 前 各 层 逐 渐进 行 的 。 
标准 的 BP 网 络 采 用 梯度 下 降 算法 ， 与 Widrow-Hoff 学 习 规则 相似 ， 网 络 权 值 沿 着 性 能 函 
数 的 梯度 的 反 向 调整 。 

目前 在 神经 网 络 的 多 数 应 用 中 , 都 采用 的 是 BP 网 络 及 其 变化 形式 。BP 神经 网 络 是 前 
向 型 网 络 的 核心 部 分 ， 具 有 广泛 的 适应 性 和 有 效 性 ， 主 要 应 用 于 模式 识别 与 分 类 、 数 据 压 
缩 和 函数 吉 近 等 方面 。 


_BP 神经 网 络 结构 


BP 神经 网 络 具 有 sigmoid 隐 层 以 及 线性 输出 层 ， 具有 很 强 的 映射 能 力 ， 本 节 我 们 将 对 
BP 网 络 神经 元 和 网 络 结构 进行 介绍 。 


10.1.1 BP 网 络 神经 元 模型 


10-1 给 出 了 一 个 具有 R 个 输入 的 基本 的 BP 神经 元 模型 结构 。 图 中 每 一 个 输入 被 赋 
予 一 定 的 权 值 ， 与 偏差 求 和 后 形成 神经 元 传递 函数 的 输入 。 





图 10-1 BP 神经 元 模型 示意 图 
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BP 网 络 属于 多 层 网 络 ， 其 神经 元 常用 的 传递 函数 包括 log-sigmoid 型 函数 logsig、 
tan-sigmoid 函数 tansig， 以 及 线性 函数 purelin， 如 图 10-2 所 示 。 











AN Co-tansig(m) rpurelintm) 


图 10-2 BP 神经 元 常用 的 几 种 传递 函数 


需要 指出 ，sigmoid 型 传递 函数 的 曲线 形状 是 S 型 的 ，log-sigmoid、tan-sigmoid 型 函 
数 都 是 如 此 。 

如 果 BP 网 络 的 输出 层 采 用 sigmoid 型 传递 函数 ， 那 么 网 络 的 输出 就 限制 在 [-1，+]1] 
范围 之 内 ， 而 如 果 采 用 线性 函数 purelin 作为 输出 层 的 传递 函数 ， 那 么 输出 可 以 取 任意 值 。 
因此 在 隐 层 中 常常 采用 sigmoid 函数 进行 中 间 结 果 的 传递 ， 而 在 最 后 输出 层 用 线性 传递 函 
数 对 输出 进行 值 域 扩展 。 

在 BP 神经 网 络 的 训练 过 程 中 ， 计 算 传递 函数 的 导数 是 非常 重要 的 。 对 于 图 10-2 中 所 
示 的 任意 一 种 传递 函数 ， 在 MATLAB 中 都 可 以 通过 在 函数 名 前 加 “d” 而 得 到 对 应 的 微分 
函数 ， 即 dlogsig、dtansig、dpurelin。 要 查询 这 些 传递 函数 的 导数 函数 名 ， 只 需 在 工作 区 
对 传递 函数 参数 输入 “deriv” 就 可 以 得 到 。 

以 上 3 种 函数 是 BP 网 络 中 最 常用 到 的 传递 函数 ,根据 用 户 需要 也 可 以 在 MATLAB 中 
自己 创建 其 他 形式 的 传递 函数 。 


10.1.2”BP 神经 网 络 结构 


图 10-3 显示 了 一 个 具有 R 个 输入 ， 由 8 个 logsig 神经 元 构成 的 单 层 网 络 。 其 中 ， 左 
边 是 详细 结构 图 ， 右 边 是 以 向 量 形式 表示 的 结构 图 。 


输入 logsig 神经 元 层 输入 logsig 神经 元 层 


a=logsig(WP+b) 





a=logsig(Wp + 
图 10-3 ” 单 层 logsig 神经 元 构成 的 网 络 结构 
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前 向 型 神经 网 络 通常 具有 一 个 或 多 个 由 sigmoid 神经 元 构成 的 隐 层 ， 以 及 一 个 由 线性 
神经 元 构成 的 输出 层 。 多 个 具有 非 线性 传递 函数 的 神经 元 层 使 得 网 络 可 以 学 习 输入 和 输出 
之 间 的 非 线 性 关系 ， 而 线性 输出 层 使 得 网 络 可 以 产生 [-1， +1] 之 外 的 输出 值 。 

当然 ， 如 果 恰好 需要 对 网 络 输出 的 值 域 加 以 限制 ， 例 如 想 要 将 网 络 输出 值 限制 在 [0， 
JJ 以 内 ， 那 么 输出 层 就 应 该 采用 sigmoid 类 型 的 传递 函数 。 

图 10-4 是 一 个 典型 的 具有 两 个 神经 元 层 的 BP 神经 网 络 ， 隐 层 传 递 函数 为 tansig， 输 
出 层 传递 函数 为 purelin 函数 。 





输入 隐 层 输出 层 





2 3 3x1 3 
ai=tansig(1WLIPLH6D) =purelin(LW2MalHb2) 
图 10-4 ”由 两 层 神经 元 构成 的 BP 网 络 结构 





_BP 网 络 学 习 规则 


BP 网 络 的 学 习 仍然 是 有 监督 学 习 ， 训 练 过 程 需要 提供 输入 向 量 上 和 期 望 响 应 +， 训练 
过 程 中 网 络 的 权 值 和 偏差 根据 网 络 误差 性 能 进行 调整 ， 最 终 实现 期 望 的 功能 。 前 向 型 神经 
网 络 仍然 采用 均 方 误差 作为 默认 的 网 络 性 能 函数 ， 网 络 学 习 的 过 程 就 是 使 均 方 误差 最 小 化 
的 过 程 。 

BP 网 络 的 学 习 算法 有 很 多 变化 形式 , 对 应 的 训练 函数 包括 traingd、traingdm 、traingdx、 
trainrp、traincgf、traincgp、traincgb、trainscg、trainbfg、trainoss、trainlm、trainbr 等 。 各 
种 训练 函数 采用 不 同 的 训练 算法 ， 其 中 最 简单 的 BP 算法 仍然 是 最 速 下 降 法 。 本 节 将 对 其 
中 最 主要 的 几 种 进行 介绍 。 


10.2.1 BP 算法 

BP 算法 沿 着 误差 函数 减 小 最 快 的 方向 ， 也 就 是 梯度 的 反方 向 改变 权 值 和 偏差 ， 这 一 
点 与 线性 网 络 的 学 习 算法 是 一 致 的 。BP 算法 的 迭代 计算 公式 可 以 表示 为 ， 

1 一 下 一 QtSk 

其 中 ， 交 代表 当前 的 权 值 和 偏差 ，xx+i 代 表 和 迭代 产生 的 下 一 次 的 权 值 与 偏差 ，8k 为 
当前 误差 函数 的 梯度 ， ak 代表 学 习 速 率 。 

下 面 以 含有 两 个 隐 层 ， 即 一 共 具 有 4 个 神经 元 层 的 BP 网 络 为 例 ， 对 学 习 算法 进行 推 
导 。 设 输入 的 数目 为 M， 其 中 任意 一 个 用 闫 来 标记 ; 第 1 个 隐 层 记 为 7， 包 含 7 个 神经 元 ， 
其 中 任意 一 个 神经 元 用 i 来 标记 ; 第 2 个 隐 层 记 为 了 ， 包 含 / 个 神经 元 ， 其 中 任意 一 个 神 

媳 晤 梧 本 195 


精通 MATLAB 神经 网 络 


经 元 用 /来 标记 ; 输出 层 记 为 P ， 包 含 尸 个 神经 元 ， 其 中 任意 一 个 用 己 来 标记 。 

例如 ， 输 入 层 与 第 1 隐 层 之 间 的 权 值 记 为 ww ， 表 示 从 输入 层 第 mm 个 神经 元 输出 到 第 
1 隐 层 第 i 个 神经 元 之 间 的 权 值 ; 第 1 隐 层 与 第 2 隐 层 之 间 的 权 值 记 为 w ; 第 2 隐 层 与 输 
出 层 之 间 的 权 值 记 为 wp。 

神经 元 的 输入 记 为 w ， 输 出 记 为 ”， 用 上 标 表示 神经 元 所 处 层 ， 下 标 表 示 层 中 的 序号 ， 
如 以 表示 第 1 隐 层 第 ;i 个 神经 元 的 输入 。 设 所 有 神经 元 的 传递 函数 均 为 sigmoid 函数 ; 训 
练 样本 集 为 X-[X)，X2， ，Xwj， 其 中 任意 一 个 训练 样本 Xx 都 是 一 个 M 维 矢量 ， 即 
和 [Xu Xe Xiur]，( 大 =12…,N ); 期 望 响应 为 du =[du, do,… dp 了， 实际 输出 
为 中 = [Wi, %a, ,Xp 。 设 为 迁 代 次 数 ， 权 值 和 实际 输出 都 是 的 函数 。 

当 网 络 输入 训练 样本 为 夺 : = [Xu, Xiaz,…, Xur] 时 ， 网 络 中 信号 以 前 向 的 方式 传递 ， 
对 于 各 层 的 中 间 值 ， 可 以 写 出 表达 式 如 下 : 

第 1 隐 层 第 ; 个 神经 元 的 输入 为 : 地 = 


风 
第 1 隐 层 第 ; 个 神经 元 的 输出 为 : 几 -/ 公 ] 


3 








5 
第 2 隐 层 第 1 个 神经 元 的 输出 为 -7( 安 ww] 
了 
输出 层 第 个 神经 元 输入 为 :xd = > wpvf 
加 


也 
输出 层 第 p 个 神经 元 输出 ， 即 网 络 输出 为 ， ym = 喀 -人 售 吕 ] 
扎 


输出 层 第 p 个 神经 元 的 输出 误差 为 : ew(= dm( 站 天 ( 
和 
定义 误差 能 量 为 eez， 输出 层 所 有 神经 元 的 误差 能 量 总 和 为 : ED = ez 


pl 
误差 与 信号 相反 ， 从 后 向 前 传播 ， 在 反 向 传播 的 过 程 中 ， 逐 层 地 修改 权 值 和 偏差 。 下 
面 计算 此 反 向 传播 和 误差 调整 的 过 程 。 


1. 隐 层 / 与 输出 层 尸 之 间 权 值 的 调整 
BP 算法 中 ， 权 值 的 调整 量 与 输出 相对 于 期 望 响应 的 误差 能 量 对 权 值 的 偏 微分 大 小 成 
正比 ， 符 号 相反 ， 下 面 计算 此 偏 微分 的 值 。 
9E(0D) _ 9E(OD Dee(D aym(CD 9up(m) 
DBwap(0D) aew(D DGnD 9u2(a 9wjp(D 
由 误差 能 量 定义 以 及 各 变量 之 间 的 关系 可 知 : 
9E(OD ae 


(10.1) 








驶 四 - rugon) ，2ee 四 


， ， = (10.2) 
一 和 人 ao az ET 
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从 而 此 偏 微分 的 值 为 : 
BE 
二 =-eo(D :Gel0D0) (0D (10.3) 
定义 局 部 梯度 为 
50D=- 35O) =ep(m. 广 (enD) (10.4) 
Bu 0) 
根据 梯度 下 降 学 习 规 则 ，wp(m) 的 修正 量 为 . 
9E 
Amwp(m=- 人 =2100 (10.5) 


其 中 刀 为 学 习 步 长 ，58 (mn) 可 以 根据 ( 10.4 ) 式 求 得 ，v; Cn) 可 以 根据 信号 正 向 传播 过 
程 求 得 ， 从 而 可 以 计算 出 下 一 次 wp(m) 的 迭代 值 。 
例如 ， 当 最 后 一 层 采用 sigmoid 传递 函数 : 


JoD= 一 -1 


一 一 一 一 0G>0 (10.6) 
1+exp( 一 ax) 


时 ， 如 果 a=1， 可 以 求 得 : 


56f(ODO=7op0D0 epoOO=yo0-yo(D(de(DO-yw(Do) (107) 
将 ( 10.7 ) 式 代 入 ( 10.5 ) 式 中 ， 即 得 到 隐 层 / 与 输出 层 忆 之 间 权 值 wp(m) 的 下 一 次 迭 
代 值 : 


Wijp(a+D= wj(D 二 Awjp(mD) (10.8) 
2. 隐 层 / 与 隐 层 ,/ 之 间 权 值 的 调整 


与 上 一 层 权 值 的 调整 类 似 ，/、/7 隐 层 权 值 的 调整 也 沿 着 梯度 下 降 方向 进行 调整 ， 其 修 
正 量 为 ， 


9E(D) 
9wi(mD) 





Awj(D)=- =761 (DonD) (10.9) 


其 中 ， 局 部 梯度 61 (m) 定义 为 ， 


9E(0D) -950D) av 3aE0D 
auf (0 Bf af ef 


将 误差 能 量 的 定义 代入 ( 10.10 ) 式 ， 经 过 化 简 后 可 以 求 得 : 


1 (=- 





:ef OoD) (10.10) 


已 
51(0D= oofoD) 2500D0:wjp(n) (10.11) 
气 
58 0) 是 输出 层 的 对 应 的 局 部 梯度 ， 已 经 在 上 一 步 计 算 中 求 得 。 对 于 假定 的 sigmoid 
函数 ，7 1 00)= 寺 0D0d- 坟 (ao) ， 因 此 代入 ( 10.11 ) 式 就 可 以 得 到 隐 层 7 与 隐 层 / 之 间 
权 值 w(m) 的 下 一 次 迭代 值 
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wa+D= woD+Awr(D (10.12 ) 
3. 输入 层 M 与 隐 层 /之 间 权 值 的 调整 
与 上 面 的 推导 类 似 ， 两 层 之 间 任 意 两 节点 之 间 的 权 值 修正 量 为 : 


Amwmi(D) =TE! (0 xn ( 10.13 ) 
其 中 的 局 部 梯度 8 (m) 为 : 


1 
81= ud on0) > 5100 ww (10.14) 
气 


而 传递 函数 的 导数 /ulf 0D) = 内 CD)(L- 坟 (CD) ，wi(Cn) 已 经 在 上 一 层 的 计算 中 求 得 ， 因 此 通 
过 下 面 的 迭代 公式 ， 就 可 以 求 得 下 一 步 和 迭代 的 输入 层 M 与 隐 层 ! 之 间 权 值 。 


wmi(Ca+DD=wmi(a)+Awmi(D) (10.15 ) 


以 上 是 我 们 以 包含 两 个 隐 层 的 全 sigmoid 传递 函数 BP 神经 网 络 为 例 , 导出 的 BP 学 习 
规则 的 权 值 迭 代 公 式 ， 偏 差 的 迭代 公式 也 可 以 用 同样 的 方法 求 得 。 

梯度 下 降 算法 的 实现 有 两 种 方式 : 一 种 是 递增 模式 ， 另 一 种 是 批 处 理 模式 。 在 递增 模 
式 下 ， 网 络 每 获得 一 个 新 的 输入 样本 ， 就 计算 一 次 梯度 并 更 新 权 值 ; 而 在 批 处 理 模式 下 ， 
网 络 需要 获得 所 有 的 输入 样本 ， 然 后 根据 所 有 的 输入 样本 来 更 新 权 值 。 下 面 的 一 节 将 对 批 
处 理 训练 模式 进行 介绍 。 


10.2.2， 批 处 理学 习 算法 


在 批 处 理 模式 下 ， 网 络 权 值 和 偏差 只 在 整个 输入 样本 集 都 已 经 获取 之 后 才 进 行 更 新 。 
将 每 次 样本 输入 时 计算 得 到 的 梯度 加 起 来 ， 得 到 最 终 的 权 值 和 偏差 。 
我 们 知道 ， 利 用 MATLAB 工具 箱 函 数 train 可 以 完成 对 网 络 的 训练 ， 在 训练 之 前 将 网 
络 对 象 的 训练 算法 trainFcn 的 值 指定 为 相应 的 算法 即 可 ， 而 另 一 种 训练 的 方法 是 ， 直接 调 
用 相关 训练 算法 的 函数 。 
例如 基本 的 BP 梯度 下 降 算 法 的 训练 可 以 通过 调用 函数 traingd 来 实现 ， 而 为 了 稳定 迭 
代 过 程 ， 减 少 振荡 ， 人 们 发 展 了 带动 量 的 梯度 下 降 算法 traingdm 来 平滑 训练 过 程 。 
标准 的 梯度 下 降 算法 和 有 动量 的 梯度 下 降 算法 应 用 于 实际 问题 时 往往 有 学 习 速率 过 
慢 的 缺陷 ， 而 且 容易 陷入 局 部 极 小 点 ， 因 此 人 们 提出 了 多 种 改进 的 高 效 BP 算法 。 下 面 将 
介绍 的 高 效 算法 的 训练 速率 通常 为 以 上 两 种 算法 的 数 十 倍 到 数 百 倍 ， 而 这 些 算法 都 是 基于 
批 处 理 训练 模式 的 。 
这 些 快 速 学 习 算法 主要 分 为 两 类 。 
。 第 一 类 是 启发 性 学 习 算法 ， 包 括 ， 可 变 学 习 速 率 的 梯度 下 降 法 、 有 动量 和 自 适 应 学 
习 速 率 的 梯度 下 降 法 、 弹 性 BP 训练 法 等 等 。 
。 第 二 类 则 是 基于 最 优化 理论 的 训练 算法 ， 包括 苍 梯度 算法 、 拟 牛顿 法 、 
Levenberg-Marquardt 算法 等 等 。 


198 办 入 从 


第 1Q 章 Bp 神经 网 络 


这 些 改进 算法 在 MATLAB 中 都 有 各 自 对 应 的 训练 函数 ， 我 们 将 在 后 续 章节 中 进行 
介绍 。 





BP 网 络 的 MATLAB 实现 


本 节 我 们 主要 通过 实例 介绍 MATLAB 中 与 BP 神 经 网 络 相关 的 网 络 创建 以 及 各 种 网 络 
训练 函数 的 应 用 。 





10.3.1 BP 网 络 的 创建 与 仿真 
MAILAB 神经 网 络 工具 箱 提供 函数 new 人 f 来 创建 一 个 前 向 型 BP 神经 网 络 。 其 常用 的 


调用 格式 为 
net = newff(P, T, [S1 S2...SIN-D]，{TFITF2..TFNI) 
其 中 ， 


。 忆 ，7 分 别 为 输入 样本 和 期 望 响应 ; 

。 Si 为 网 络 各 层 的 神经 元 数目 ; 

。TFi 为 网 络 各 层 的 传递 函数 类 型 。 

默认 情况 下 ， 网 络 中 间 隐 层 采 用 tansig 函数 ， 输 出 层 采用 purelin 函数 。 函 数 执行 的 结 
果 是 返回 一 个 N 层 前 向 型 的 BP 神经 网 络 。 

利用 sim 函数 仍然 可 以 实现 网 络 对 一 定 输入 的 仿真 ， 得 到 其 仿真 输出 。 


【 例 10-1】  BP 网 络 创建 实例 。 给 定 一 定 的 输入 样本 和 目标 响应 ， 应 用 newff 函数 生 
成 一 个 单 输入 的 单 隐 层 BP 网 络 并 对 其 进行 仿真 。 
解 ， 人 @ 首先 定义 网 络 的 输入 向 量 与 期 望 响应 。 输 入 命 


Pp=[012345678910]; 
T=s[r01234321234]; 


人 @ 然后 调用 newff 函数 生成 一 个 单 隐 层 的 BP 网 络 ， 该 隐 诗 包含 5 个 神经 元 。 输 入 
命令 

net = newff(P,T,5) 7 

合 对 网 络 进行 仿真 ， 并 将 结果 以 图 形 输出 。 输 入 命令 : 


Y = sim(net,P)， 
plot (PT,P,Y,，'o') 7 


绘 出 的 图 形 如 图 10-5 所 示 。 

在 图 10-5 中 直线 代表 期 望 响 应 ， 贺 点 代表 真实 的 网 络 响应 ， 两 者 有 一 定 的 差距 。 
此 外 要 注意 的 是 ，newff 函数 直接 生成 的 网 络 具 有 一 定 随机 性 ， 重 复 上 述 命令 绘 出 的 响 
应 图 每 次 都 不 一 样 。 要 使 得 输出 接近 于 期 望 响 应 ， 还 需要 对 网 络 进行 训练 ， 我 们 在 下 
一 节 中 介绍 。 
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图 10-5 初始 生成 网 络 的 输出 与 期 望 响应 图 


10.3.2”BP 网 络 的 训练 


前 面 我 们 说 过 ， 对 网 络 进行 训练 既 可 以 在 指定 学 习 算 法 的 条 件 下 调用 普通 的 train 函 
数 ， 也 可 以 直接 调用 不 同 训练 算法 的 对 应 函数 。 要 应 用 不 同 的 训练 算法 对 网 络 进行 训练 ， 
可 以 执行 下 面 两 个 步骤 : 

(1 ) 设置 生成 的 网 络 对 象 .trainParam.Fcn 为 对 应 的 函数 名 ; 

( 2 ) 调用 train 函数 对 网 络 进行 训练 。 

下 面 对 其 进行 实例 说 明 。 


1. 直接 用 train 函数 对 BP 网 络 进行 训练 


【 例 10-2】 。BP 网 络 训练 实例 1。 针 对 【 例 10-1 】 中 的 网 络 ， 用 train 函数 对 其 进行 
训练 并 仿真 ， 使 其 适应 于 给 定 的 输入 和 输出 样本 。 
解 ， 这 里 直接 调用 train 函数 来 对 网 络 进行 训练 ， 设 定 训练 的 目标 为 0.001， 并 绘 出 输出 图 
与 期 望 响应 进行 比较 。 

在 完成 【 例 10-1 】 的 基础 上 ， 继 续 输入 如 下 命令 : 

net .rainParam.EFcn = 'Eraingd' 

met .trainParam.goal = 0.001; 

net = train(net,P,T)7 

Y = sim(net,P) 

plot(P,T,P,Y,，'o') 7 


注意 因为 创建 网 络 时 ， 黑 认 的 网 络 学 习 函 数 为 trainlm,， 因 此 这 里 网 络 训练 采用 的 学 习 
算法 是 raingd'， 经 过 训练 后 ， 绘 出 的 输出 图 形 如 图 10-6 所 示 。 
可 以 看 到 ， 训 练 后 的 网 络 输出 与 期 望 响应 符合 程度 比 训练 前 有 了 很 大 的 提高 
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图 10-6 ”训练 后 网 络 的 输出 与 期 望 响应 图 


2.， 利用 标准 的 梯度 下 降 算 法 对 网 络 进行 训练 


标准 的 梯度 下 降 算 法 对 应 算法 名 为 “traingd"。 因 此 ， 用 基本 的 BP 训练 算法 对 网 络 进 


行 训练 ， 只 需要 将 生成 网 络 的 nettrainParam.Fcn 参数 设置 成 traingd'， 然 后 再 调用 train 函 
数 即 可 。 下 面 举例 说 明 。 


【 例 10-3】〗】 BP 网 络 训练 实例 2。 对 样本 数据 P=[-1，-1，2,，2; 0,， 5，0,， 5]，T=[-1， 


-1，1，1， 生 成 BP 网 络 并 应 用 基本 的 梯度 下 降 算法 对 其 进行 训练 。 
解 ， (首先 定义 输入 和 输出 样本 。 输 入 命令 ， 


Be[-1 -12210505]: 
T=[-1 -1 2 2]; 


全 然后 生成 与 输入 、 输 出 对 应 的 BP 网 络 。 输 入 命令 ， 
net=newff (minmax(P), [3,1],{ 'tansig','purelin'),'trainga') 
人 鲜 接 下 来 设 定 网 络 训练 参数 。 输 入 如 下 命令 : 


met .上 rainParam.1Lr=0.05; 
net .trainParam.epochs=3007 
met ,rainParam.goal=1e-57 


人 @@ 下 面 对 网 络 进行 训练 。 输 入 命令 ， 
[net ,tr]=train(net,P,T) 


在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 训 练 过 程 中 网 络 误差 性 能 的 变化 如 图 10-7 


所 示 。 


侠 经 过 158 次 迭代 ， 训 练 后 网 络 的 误差 降 到 了 le-5 以 下 ， 训 练 完成 。 我 们 下 面 对 网 


络 进行 仿真 。 输 入 命 


Y = sim(net,P)， 
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输出 结果 为 : 


Y= -0.9969 -1.0003 2.0043 ”1.9966 


可 以 看 到 ， 网 络 的 输出 与 期 望 响应 是 很 接近 的 ， 这 表明 经 过 训练 后 的 BP 网 络 完成 了 
输入 、 输 出 样本 的 映射 。 





Best Training Perormance 过 NaN 可 epoch 148 
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厂 ， 页 
148 Epochs 
图 10-7 训练 中 网 络 误差 性 能 的 变化 图 


3 有 动量 的 梯度 下 降 算法 

标准 的 梯度 下 降 法 在 调整 权 值 时 ， 仅 仅 按照 当前 时 刻 的 负 梯 度 方 向 进行 调整 ， 并 没有 
考虑 以 前 各 次 运算 步骤 中 的 梯度 方向 ， 因 此 新 的 样本 对 和 迭代 过 程 影响 太 大 ， 可 能 会 导致 训 
练 过 程 中 调整 方向 发 生 振荡 ， 导 致 不 稳定 和 收敛 速度 慢 的 问题 。 有 动量 的 梯度 下 降 算法 则 
考虑 了 往 前 时 刻 的 贡献 ， 其 权 值 迭 代 公 式 如 下 所 示 : 


w+D=wCoO+TG-oODOD+wDO 一 I 


式 中 ，D(a) ，DW:-1D 分 别 表示 时刻，m1 时 刻 的 负 梯 度 。 由 于 加 入 了 以 前 时 刻 梯 
度 的 贡献 ， 相 当 于 给 迭代 过 程 添加 了 一 个 低 通 滤波 器 ， 这 样 可 以 使 得 网 络 忽略 误差 曲面 上 
的 细节 特征 ， 从 而 避免 了 陷入 局 部 极 小 点 的 问题 

在 MATLAB 中 ， 有 动量 的 梯度 下 降 算法 对 应 的 函数 为 traingdm， 下 面 举例 说 明 应 用 
traingdm 的 训练 过 程 。 


【 例 10-4】 BP 网 络 训练 实例 3。 对 【 例 10-3】 中 的 输入 和 输出 样本 ， 采 用 带动 量 的 
梯度 下 降 算法 对 生成 网 络 进行 训练 。 
解 ， 全 利用 newff 函数 生成 网 络 。 在 newff 函数 中 , 设 定 学 习 算法 为 aingdmo 输入 如 下 


命令 
节令 : 





P=[-1 -12 2;0505]， 
Te[-i 12 -233 
net=newff(tminmax(P),[3,1],{ "tansig'，'purelin'}，'traingdm') 7 
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人 @@ 同样 ， 设 定 网 络 训练 参数 并 进行 训练 。 输 入 命令 如 下 ， 


met .trainParam.lr=0.05; 
met .trainParam.epochs=3001; 
net .rainParam.goal=le-5; 
[net,tr]=train(net,P,T); 


在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 生 成 的 误差 性 能 曲线 图 如 图 10.8 所 示 。 


Best Training Perprmance 车 NaN 异 gpoch 256 











仙 
葬 Epochs 
图 10-8 ”有 动量 的 梯度 下 降 算法 训练 过 程 中 网 络 误差 性 能 的 变化 图 


侠 可 以 看 到 ， 经 过 了 266 次 迭代 之 后 ， 网 络 训练 达到 了 期 望 的 误差 水 平 。 
下 面 应 用 sim 函数 进行 网 络 仿真 。 输 入 命令 ， 


Y = sim(net,P) ， 
输出 结果 为 ， 
Y= -1.0031 -0.9982 2.0037 “1.9964 


这 说 明 ， 训 练 后 的 网 络 是 能 够 完成 输入 与 输出 样本 之 间 的 映射 的 。 


4， 可 变 学 习 速 率 的 梯度 下 降 算法 

在 标准 的 梯度 下 降 算法 中 ， 训 练 过 程 中 学 习 速 率 是 固定 的 。 算 法 的 性 能 对 于 学 习 速 率 
的 设 定 值 非常 敏感 。 如 果 学 习 速 率 设 得 过 高 ， 可 能 导致 训练 过 程 出 现 振荡 以 及 不 稳定 ， 而 
如 果 学 习 速率 设 得 过 低 ， 又 会 导致 收敛 时 间 过 长 。 然 而 ， 事 先知 道 一 个 最 佳 的 学 习 速率 并 
不 是 一 件 很 容易 的 事 ， 并 且 随 着 训练 的 进行 ， 网 络 的 误差 性 能 点 在 误差 性 能 曲面 上 不 断 地 
移动 ， 最 佳 的 学 习 速率 也 是 随 之 不 断 变动 的 。 

如 果 将 学 习 速率 设 定 为 可 变 的 ， 那 么 就 可 以 改善 训练 算法 的 性 能 。 具 备 自 适 应 学 习 速 
率 的 梯度 下 降 算法 可 以 在 保持 训练 过 程 稳定 的 前 提 下 采用 最 大 的 学 习 步 长 。 当 前 的 学 习 速 
率 是 根据 误差 曲面 的 局 部 复杂 性 来 确定 的 。 

在 MATLAB 中 ,可 变 学 习 速 率 的 梯度 下 降 算法 对 应 的 函数 为 raingda。 下 面 对 其 应 用 
效果 进行 举例 说 明 。 
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【 例 10-5〗  BP 网 络 训练 实例 4。 对 【 例 10-4 】 中 的 输入 和 输出 样本 ， 采 用 可 变 学 习 
速率 梯度 下 降 算法 对 生成 网 络 进行 训练 。 


解 : @@ 利用 newff 函数 生成 网 络 。 在 newff 函数 中 , 设 定 学 习 算 法 为 raingda。 输入 命令 ， 


05-0 5]7 





net=newff (minmax(P),[3,1],{'cansig'，'purelin'}，'traingda')7 


全 设 定 网 络 训练 参数 并 进行 训练 。 输 入 如 下 命 
net .trainParam.lLr=0.057 
net .上 trainparam.epochs=300; 


net .trainParam.goal=le-5; 
[net,tr]=train (net,P,T); 


在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 生 成 的 误差 性 能 曲线 如 图 10-9 所 示 。 


Be Traing Parlommance ia NaN 对 eppch 4 














图 10-9 可 变 学 习 速率 的 梯度 下 降 算法 训练 过 程 中 网 络 误差 性 能 的 变化 


可 以 看 到 , 经 过 了 40 次 迭代 , 网 络 就 达到 了 期 望 的 误差 性 能 , 这 相对 于 前 面 的 traingd 
和 traingdm 的 训练 来 说 ， 训 练 速度 得 到 了 很 大 的 提升 。 

合 接 下 来 应 用 sim 函数 进行 仿真 。 输 入 命令 

Y = sim(net,P)， 

输出 结果 为 ， 

Y = -1.0001 -0.9972 1.9966 2.0009 

这 说 明 以 traingda 算法 训练 后 的 网 络 同样 是 符合 要 求 的 。 
5. 弹性 梯度 下 降 算法 

多 层 神经 网 络 通常 在 隐 层 中 采用 sigmoid 型 的 传递 函数 。 由 于 sigmoid 函数 的 作用 是 
将 无 限 的 输入 范围 压缩 到 一 个 有 限 的 输出 范围 内 ， 因 此 它们 都 有 这 样 一 个 特性 ， 即 输入 样 
本 变 得 非常 大 的 时 候 ， 函 数 曲 线 斜率 将 会 逐渐 接近 于 0。 这 可 能 造成 的 一 个 问题 ， 即 如 果 
采用 最 陡 下 降 法 对 网 络 进行 训练 ， 梯 度数 值 有 可 能 会 很 小 ， 这 样 每 一 次 闪 代 权 值 和 偏差 的 
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改变 量 会 很 小 ， 尽 管 它们 距离 最 优 值 还 有 很 远 的 距离 。 

有 弹性 的 BP 训练 算法 的 目标 就 是 消除 由 于 误差 函数 偏 微分 的 数值 上 变动 所 造成 的 不 
利于 训练 的 效应 。 在 这 种 算法 下 ， 只 通过 偏 微分 函数 符号 决定 权 值 的 变化 方向 ， 而 忽略 偏 
微分 数值 的 大 小 ， 权 值 变化 量 则 由 一 个 独自 更 新 的 数值 来 决定 。 

如 果 连 续 两 次 迁 代 中 误差 性 能 函数 对 某 一 权 值 的 偏 导数 的 正 负 号 相同 ， 则 权 值 更 新 值 
会 增 大 ， 而 如 果 连 续 两 次 迭代 中 误差 性 能 函数 对 某 一 权 值 的 偏 导数 的 正 负 号 相同 ， 则 权 值 
更 新 值 会 减 小， 如 果 偏 导数 等 于 0， 则 停止 适 代 。 这 样 权 值 的 变动 过 程 是 一 个 幅度 逐渐 减 
小 的 振荡 过 程 ， 最 后 收敛 到 梯度 为 0 的 目标 点 。 

在 MATLAB 中 ， 弹 性 梯度 下 降 算法 对 应 的 函数 为 trainrmp。 下 面 我 们 以 例题 的 形式 对 
其 进行 说 明 。 

【 例 10-6〗 。BP 网 络 训练 实例 5。 对 【 例 10-5】 的 输入 和 输出 样本 ， 利 用 弹性 梯度 下 
降 算法 对 生成 网 络 进行 训练 。 

解 ， 人 @ 利用 new 从 函数 生成 网 络 。 在 newff 函数 中 ， 设 定 学 习 算法 为 tainrmp。 输 入 命令 ， 

P=[-1 -122;!0505]， 


T=[-1 -1 2 2]); 
met=newff(minmax(P), [3,1],{ 'tansig'，'purelin'),'trainrp') 


全 设 定 网 络 训练 参数 并 进行 训练 。 输 入 如 下 命令 : 


net .rainParam.lr=0.05; 
net .rainParam.epochs=300; 
net .trainParam.goal=1le-57 
[net ,tr]=train(nec,P,T) 7 


在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 误 差 性 能 曲线 图 如 图 10-10 所 示 。 

















图 10-10 ”弹性 梯度 下 降 算 法 训练 过 程 中 网 络 误差 性 能 的 变化 


可 以 看 到 ， 经 过 了 17 次 和 迭代 网 络 达到 了 期 望 的 误差 性 能 ， 并 且 在 弹性 梯度 训练 算法 
下 网 络 误差 性 能 的 振荡 变化 特性 表现 得 很 明显 。 
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全 下 面 我 们 对 其 进行 仿真 。 输 入 命令 : 


Y = sim(net,P)， 

输出 结果 为 : 

Y = -0.9906 -0.9949 1.9825 1.9858 
这 验证 了 网 络 实现 了 输入 和 输出 目标 样本 的 映射 


6 Fletcher-Reeves 共 斩 梯 度 算法 

尽管 标准 的 BP 算法 采用 梯度 下 降 算 法 ， 权 值 和 偏差 沿 误差 函数 下 降 最 快 的 方向 进行 
调整 ， 但 却 并 不 一 定 是 收敛 最 快 的 算法 。 在 改进 的 BP 训练 算法 中 ， 有 一 大 类 的 算法 称 为 
共 斩 梯 度 算法 。 在 这 一 类 算法 中 ， 权 值 和 偏差 沿 着 共 斩 梯 度 方向 进行 调整 ， 通 常 能 够 获得 
比 标准 的 梯度 算法 更 快 的 收敛 速度 。 

共 斩 梯 度 算法 的 第 一 次 迭代 都 从 最 陡 下 降 的 梯度 方向 开始 。 梯 度 向 量 为 ， 





Po = 一 80 
沿 着 此 方向 进行 权 值 和 偏差 的 调整 ， 公 式 为 : 
XUk+1 = k 十 CKP 
下 一 次 搜索 方向 则 由 前 两 次 搜索 方向 的 共 到 方向 决定 ， 表 达 式 为 : 
必 = 一 8 十 大 Pt 
对 于 系数 把 的 不 同 计算 方法 产生 出 不 同 的 共 斩 梯 度 算法 。 其 中 FletcherReeves 方法 采 
取 的 系数 确定 方法 为 : 
-BEE 
-Bt-l 
此 系数 含义 是 本 次 迭代 梯度 相对 于 上 一 次 迭代 梯度 的 归 一 化 值 。 在 MATLAB 中 此 算 
法 对 应 的 函数 为 raincgf。 下 面 应 用 此 函数 对 【 例 10-6】 进 行 分 析 。 
【 例 10-7】  BP 网 络 训练 实例 6。 用 Fletcher-Reeves 共 斩 梯 度 算法 对 【 例 10-6】 的 网 
络 进行 训练 。 
解 : @@ 利用 newff 函数 生成 网 络 。 在 newff 函数 中 ， 设 定 学 习 算法 为 raincgf。 输 入 命令 ; 
P=[-1 -122;0505]， 
T=[-1 -1 2 2]; 
net -newff (minmax(P),[3,1],{ 'tansig','purelin')，'craincgf') 1 


全 设 定 网 络 训练 参数 并 进行 训练 。 输 入 如 下 命令 : 


net .ErainParam.lr=0-057 
net .trainParam.epochs=300; 
net .上 rainParam.goal=1e-57 
[net,tr]=train(net,P,T) 7 
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在 弹出 的 窗口 中 ， 单 击 “Performance” 按 钮 ， 生 成 的 误差 性 能 曲线 如 图 10-11 所 示 。 


洛 Best Tmming Peromance is NaN 驱 epoch 7 











图 10-11 Fletcher-Reeves 苍 梯度 算法 训练 过 程 中 网 络 误差 性 能 的 变化 


可 以 看 到 , 只 经 过 了 7 次 迭代 , 网 络 就 达到 了 期 望 的 误差 性 能 。 这 说 明 Fletcher-Reeves 
共 桃 梯度 算法 的 收 伊 速度 是 非常 快 的 。 
全 下 面 对 其 进行 仿真 。 输 入 命令 : 
Y = sim(net,P)， 
输出 结果 为 ， 
Y 到 ~0.9985 -1.0003 1.9940 2.0006 
这 个 结果 验证 了 经 过 训练 后 的 BP 网 络 性 能 符合 需求 。 
7. Polak-Ribi6re 共 斩 梯 度 算法 
Polak-Ribiere 共 罗 梯 度 算法 采取 的 共 斩 梯度 系数 计算 公式 如 下 ， 
有 = AgE-B4 
Bt-18k-1 
此 系数 为 上 次 迭代 梯度 与 本 次 迭代 的 梯度 的 内 积 对 本 次 梯度 的 归 一 化 值 。 在 MATLAB 
中 此 算法 对 应 的 函数 为 raincgp， 下 面 应 用 此 算法 对 网 络 进行 训练 和 仿真 。 
【 例 10-8】 BP 网 络 训练 实例 7。 用 Polak-Ribiere 共 斩 梯 度 算 法 对 【 例 10-7】 的 网 络 
进行 训练 。 
解 : @ 利用 newff 函数 生成 网 络 。 在 newff 函数 中 , 设 定 学 习 算法 为 taincgp。 输入 命令 ， 


Be[-i -12 2 050 5]， 
人 122 
net=newff (minmax(P)，,[3,1],{ 'tansig'，'purelin'),'traincgp')) 


人 @@ 设 定 网 络 训练 参数 并 进行 训练 。 输 入 如 下 命令 ， 


met .trainpParam.lr=0.057 


后 司 本 本 207 


请 通 MATLAB 神经 网 络 


net .上 rainParam.epochs=300; 
net .trainParam.goal=1le-57 
[net,tr]=train(net,P,T) 7 


在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 生 成 的 误差 性 能 曲线 如 图 10-12 所 示 。 


Best Training Perormance is NaN epoch 1 

















过 
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图 10-12 ”Polak-Ribiere 芥 梯度 算法 训练 过 程 中 网 络 误差 性 能 的 变化 


可 以 看 到 ， 经 过 了 10 次 迭代， 网 络 就 达到 了 期 望 的 误差 性 能 ， 收 伊 速度 与 
Fletcher-Reeves 共 斩 梯 度 算法 基本 相当 。 
全 下 面 对 其 进行 仿真 。 输 入 命令 ， 


Y = sim(net,P)， 

输出 结果 为 ， 

二 -0.9988 -1.0012 2.0027 1.9997 

这 验证 了 经 过 训练 后 的 BP 网 络 性 能 符合 需求 。 
8. Powel-Beale 重 置 花 梯度 算法 


对 于 所 有 的 共 罗 梯 度 算法 ， 搜 索 方向 需要 周期 性 地 重 置 为 当前 负 梯 度 方向 。 重 置 点 通 
常 选 取 在 迭代 次 数 与 网 络 设置 的 训练 参数 相等 的 时 候 ， 但 也 存在 其 他 的 重 置 方法 ， 以 提高 
训练 的 效率 ，PowelL-Beale 方法 就 是 其 中 的 一 种 。 

在 此 方法 中 ， 如 果 上 一 次 的 梯度 方向 与 本 次 梯度 方向 之 间 正 交 性 很 低 的 时 候 ， 就 重 置 
搜索 方向 。 具 体 判 据 由 下 式 决 定 : 


je 人 >02|e 直 


一 旦 当前 梯度 与 上 一 次 梯度 满足 此 不 等 式 ， 就 对 搜索 方向 进行 重 置 。 在 MATLAB 中 
此 算法 对 应 的 函数 为 raincgb。 下 面 应 用 此 算法 对 网 络 进行 训练 和 仿真 。 


【 例 10-9】  BP 网 络 训练 实例 8。 用 Powell-Beale 共 斩 梯 度 算法 对 【 例 10-8】 的 网 络 
进行 训练 。 
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解 ， @ 利用 newff 函数 生成 网 络 。 在 newff 函数 中 ,， 设 定 学 习 算法 为 traincgb。 输 入 命令 : 
P=[-1 -122;0505]， 
T=[-1 -1 2 2]; 
met=newff(minmax(P),[3,1],{ "cansig','purelin'}， 


人 @@ 设 定 网 络 训练 参数 并 进行 训练 。 输入 如 下 命令 : 


net ,trainParam.lr=0.057 
Pet .trainParam.epochs=3007 
met .上 rainParam.goal=le-5; 
[net,tr]=train(net,P,T) 


"traincgb') 7 


在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 生 成 的 误差 性 能 曲线 如 图 10-13 所 示 。 








图 10-13 Powell-Beale 共 三 梯度 算法 训练 过 程 中 网 络 误差 性 能 的 变化 
可 以 看 到 ， 经 过 了 9 次 和 迭代， 网 络 达到 了 期 望 的 误差 性 能 。 
侠 下 面 对 其 进行 仿真 。 输 入 命令 : 
Y = sim(net,P) ， 
输出 结果 为 ， 
Y = -1.0010 -0.9990 2.0051 2.0002 
这 验证 了 经 过 训练 后 的 BP 网 络 性 能 符合 需求 。 
9，Scaled 共 罗 梯度 算法 


到 目前 为 止 ， 讨 论 过 的 所 有 共 三 梯度 算法 都 需要 在 每 一 步 和 迭代 过 程 中 对 搜索 方向 进行 
计算 ， 这 样 的 计算 量 是 比较 大 的 。 对 此 Moller 提出 了 Scaled 梯度 搜索 算法 ， 在 每 一 步 迭 
代 过 程 中 不 计算 搜索 方向 ， 以 减少 训练 过 程 中 的 计算 量 。 在 MATLAB 中 对 应 此 算法 的 函 
数 为 trainscg， 下 面 举 例 对 其 说 明 。 


【 例 10-10】 。 BP 网 络 训练 实例 9。 用 Scaled 共 瑟 梯度 算法 对 上 例 的 网 络 进行 训练 。 
解 : @ 利用 newff 函数 生成 网 络 。 在 newff 函数 中 ， 设 定 学 习 算法 为 rainscg。 输 入 命令 : 
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P=[-1 -122;0505]， 
T=[-1 -1 2 2]; 
net=newff (minmax(P),[3,1],{'cansig'，'purelin'}，'trainscg') 7 


人 @ 设 定 网 络 训练 参数 并 进行 训练 。 输 入 命令 如 下 : 


met .trainParam.lr=0.05; 
met .ErainParam.epochs=300; 
met .rainParam.goal=le-57 
[net,trz]=train(net,P,T) 7 


在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 生 成 的 误差 性 能 曲线 如 图 10-14 所 示 。 




















图 10-14 ”Scaled 共 思 梯 度 算法 训练 过 程 中 网 络 误差 性 能 的 变化 

可 以 看 到 ， 经 过 了 6 次 迭代 ， 网 络 达到 了 期 望 的 误差 性 能 。 

侠 下 面 对 其 进行 仿真 。 输 入 命令 : 

Y = sim(net,P)， 

输出 结果 为 ， 

Y= -0.9970 -1.0043 1.9969 1.9994 

这 验证 了 经 过 训练 后 的 BP 网 络 性 能 符合 需求 。Scaled 共 罗 梯 度 算法 收敛 所 需 的 迭代 
次 数 有 时 比 其 他 共 罗 梯 度 算法 要 多 ， 但 是 每 一 次 迭代 所 需要 计算 量 却 大 大 减少 了 ， 因 为 在 
这 种 算法 中 ， 不 需要 计算 搜索 方向 。Scaled 共 斩 梯度 算法 所 需 的 存储 量 与 Fletcher-Reeves 
方法 大 致 相等 。 
10. BFGS 拟 牛 顿 法 

拟 牛 顿 法 是 共 斩 梯 度 算 法 之 外 的 另 一 种 快速 学 习 算法 。 标 准 的 牛顿 法 迭代 公式 为 ， 


一 1 
HI 一 了 一 4 8 


其 中 人 k 是 误差 性 能 函数 对 当前 权 值 和 偏差 的 二 阶 微分 构成 的 Hessian 矩阵 。 拟 牛顿 法 
通常 比 共 地 梯 度 算法 要 收敛 得 更 快 ， 然 而 遗憾 的 是 ， 对 于 前 向 型 BP 网 络 ， 计 算 Hessian 
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和 珑 阵 是 一 项 计算 量 耗 费 很 大 的 工作 。 


于 是 人 们 发 展 了 一 类 基于 牛顿 法 但 是 不 需要 计算 Hessian 和 矩阵 的 算法 ， 这 一 类 算法 被 


称 为 拟 牛顿 法 。 在 这 一 类 方法 中 ， 每 一 次 迭代 计算 一 个 近似 Hessian 和 矩阵， 此 更 新 值 是 梯 
度 的 函数 。 在 公开 发 表 的 拟 牛 顿 法 中 ， 以 Broyden、Fletcher、Goldefarb 和 Shanno 发 表 的 
方法 最 为 成 功 ， 这 种 方法 被 称 为 BFGS 拟 牛顿 法 。 


MATLAB 工具 箱 提 供 了 函数 trainbfg 以 实现 BFGS 拟 牛顿 算法 。 下 面 通过 实例 对 其 进 


行 说 明 。 


【 例 10-11】 。 BP 网 络 训练 实例 10。 用 BFGS 拟 牛顿 算法 对 上 例 的 网 络 进行 训练 。 
轩 利用 newff 函数 生成 网 络 。 在 newf 函数 中 , 设 定 学 习 算法 为 rainbfg。 输 入 命令 ， 
pP=[-1 -122;0505]， 

T=[-1 -1 2 2]: 

met=newff (minmax(P),[3,1],{ "tansig'，'purelin'}，'trainbfg')) 


全 设 定 网 络 训练 参数 并 进行 训练 。 输 入 如 下 命令 ， 


met .上 rainParam.lr=0.051; 
met .上 rainParam.epocl 0; 
net .上 trainParam.goal=le-5; 
[net,tz]=train(nec,P,T) 7 


在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 生 成 的 误差 性 能 曲线 如 图 10-15 所 示 。 


RD 
二 



























图 10-15 BFGS 拟 牛 顿 算法 训练 过 程 中 网 络 误差 性 能 的 变化 


可 以 看 到 ， 经 过 了 7 次 迭代 ， 网 络 达到 了 期 望 的 误差 性 能 。 
侠 下 面 对 其 进行 仿真 。 输 入 命令 : 


Y = sim(net,P)， 
输出 结果 为 : 


Y= -0.9969 -1.0000 已 让 乡 和 作 1.9996 
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这 个 结果 验证 了 经 过 训练 后 的 BP 网 络 性 能 符合 需求 。BFGS 算法 相对 于 共 斩 梯 度 法 
而 言 ， 收 敛 的 迭代 次 数 更 少 ， 但 是 通常 需要 更 多 的 存储 空间 和 计算 量 ， 这 是 因为 需要 存储 
近似 Hessian 矩阵 的 缘故 。 对 于 非常 大 的 网 络 , Hessian 矩阵 所 消耗 的 存储 资源 是 相当 大 的 ， 
而 对 于 比较 小 的 网 络 ，BFGS 方法 是 一 个 比较 有 效 的 训练 算法 。 

11. 一 步 正 割 算法 

由 于 BFGS 比 共 斩 梯 度 算 法 需要 更 多 的 存储 空间 和 计算 量 , 所 以 人 们 开始 寻求 需要 
更 少 的 存储 和 计算 资源 的 正 割 方法 。 一 步 正 割 算法 就 是 介 于 拟 牛 顿 法 与 共 斩 梯 度 算法 
之 间 的 算法 ， 它 不 需要 存储 整个 Hessian 和 珑 阵 ， 并 且 假 定 对 于 每 一 次 迭代 ， 上 一 次 的 
Hessian 矩阵 都 是 恒定 不 变 的 。 这 样 带 来 的 好 处 是 ， 在 计算 新 的 搜索 方向 时 就 不 需要 对 
矩阵 求 关 了 。 

MATLAB 工具 箱 提供 了 函数 trainoss 以 实现 一 步 正 割 算法 。 下 面 通过 实例 对 其 进行 
说 明 。 

【 例 10-12〗 。BP 网 络 训练 实例 11。 用 一 步 正 割 算 法 对 上 例 的 网 络 进行 训练 。 

解 ， 人 利用 newff 函数 生成 网 络 。 在 newff 函数 中 , 设 定 学 习 算 法 为 rainoss。 输 入 命令 ， 

P=[-1 -122;0505]， 


T=[-1 -1 2 2]; 
net=newff (minmax(P),[3,1],{(“'cansig'，'purelin'}，'trainoss') 7 


全 设 定 网 络 训练 参数 并 进行 训练 。 输 入 如 下 命令 : 


net .rainpParam.lr=0.057 
net .上 trainParam.epochs=300; 
net ,trainParam.goal=1le-5; 
[net,tr]=train (net,P,T) 7 





在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 生 成 的 误差 性 能 曲线 如 图 10-16 所 示 。 
Beat Traing Perommance ia NaN 址 epoch 10 











iD 
图 10-16 “一步 正 割 算法 训练 过 程 中 网 络 误差 性 能 的 变化 
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可 以 看 到 ， 经 过 了 10 次 欠 代 ， 网 络 达到 了 期 望 的 误差 性 能 。 

人 3》 下 面 对 其 进行 仿真 。 输 入 命令 : 

Y = sim(net,P)， 

输出 结果 为 ， 

于: -1.0022 -0.9974 2.0020 2.0007 

这 个 结果 验证 了 经 过 训练 后 的 BP 网 络 性 能 符合 需求 。 一 步 正 割 算法 相对 于 BFGS 拟 
牛顿 法 而 言 ， 需 要 的 计算 量 和 存储 资源 都 有 所 减少 ， 但 是 相对 于 共 到 梯 度 算法 而 言 有 所 增 
加 ， 可 以 认为 是 拟 牛 顿 法 与 苍 梯度 算法 的 折 中 。 


12，Levenberg-Marquardt 算法 


和 拟 牛顿 算 法 一 样 ，Levenberg-Marquardt 算法 也 是 期 望 在 不 计算 Hessian 矩阵 的 情况 
下 获得 高 阶 的 训练 速度 。 我 们 知道 , 误差 性 能 函数 可 以 表示 为 平方 和 的 形式 , 此 时 ,Hessian 
矩阵 可 以 近似 为 ， 


妃 =JTJ 
而 梯度 为 
8=JTe 


其 中 ，V/ 为 雅 可 比 短 阵 ， 包含 了 网 络 误差 函数 对 于 权 值 和 偏差 的 一 阶 导数 ，e 是 网 络 
误差 向 量 。 雅 可 比 矩阵 可 以 通过 标准 的 BP 算法 计算 得 到 ， 这 样 的 计算 量 要 比 直接 计算 
Hessian 矩阵 减少 很 多 。 

Levenberg-Marquardt 算法 的 更 新 过 程 与 牛顿 法 类 似 ， 其 中 应 用 了 上 述 方法 来 近似 计算 
Hessian 矩阵 。 公 式 表达 如 下 : 


xl=x -LTT+ADTJTe 


其 中 ， 如 果 标量 因子 /=0 的 话 ， 就 变 成 近似 Hessian 矩阵 的 拟 牛顿 法 ; 如 果 因 子 上 很 
大 的 话 ， 即 成 为 小 步 长 的 梯度 下 降 法 ， 由 于 牛顿 法 在 误差 极 小 点 附近 通常 能 够 确定 收敛 得 
更 快 更 精确 ， 因 此 算法 的 目的 就 是 尽快 转换 为 牛顿 法 。 因 此 如 果 训 练 成 功 ， 误 差 性 能 函数 
减 小 ， 那 么 就 碱 小 的 值 ， 而 如 果 训练 失败 ， 就 增加 A 的 值 。 利 用 这 样 的 方法 ， 可 以 使 得 
误差 性 能 函数 随 着 迭代 的 进行 而 下 降 到 极 小 值 。 

MATLAB 工具 箱 提 供 了 函数 trainlm 以 实现 Levenberg-Marquardt 算法 。 我 们 利用 newff 
函数 生成 神经 网 络 的 时 候 ， 如 果 不 指定 学 习 算 法 ， 网 络 的 默认 学 习 算法 就 是 
Levenberg-Marquardt。 如 【 例 10-2 】 直接 调用 train 函数 进行 训练 即 可 。 下 面 再 通过 另 一 个 
实例 对 其 应 用 进行 说 明 。 


【 例 10-13】 。 BP 网 络 训练 实例 12。 用 Levenberg-Marquardt 算法 对 上 例 的 网 络 进 
行 训 练 。 
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解 : 人 利用 newff 函数 生成 网 络 。 在 newff 函数 中 ， 设 定 学 习 算法 为 rainlm。 输 入 命令 : 
P=[-1 -122;0505] 

1 -123]; 

nec=newff (minmax(P),[3,1],{ 'tansig','purelin'],'trainlm') 7 


全 设 定 网 络 训练 参数 并 进行 训练 。 输 入 如 下 命令 : 


net ,rainParam.1r=0.057 
met .trainParam.epochs=3001 
net .上 trainParam.goal=1le-57 
[net,tr]=train(net,P,T) 7 


在 弹出 的 窗口 中 单 击 “Performance” 按 钮 ， 生 成 的 误差 性 能 曲线 如 图 10-17 所 示 。 








Best Training Perommance 二 NeN 友 epoch 6 
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] 吕 人 二 本 与 吾 
图 10-17 “Levenberg-Marquardt 算法 训练 过 程 中 网 络 误差 性 能 的 变化 

可 以 看 到 ， 经 过 了 6 次 迭代 ， 网 络 达到 了 期 望 的 误差 性 能 。 

人 @》 下 面 对 其 进行 仿真 。 输 入 命令 : 

Y = sim(net,P)， 

输出 结果 为 ， 

立 = -0.9991 -0.9996 2.0011 2.0000 

这 个 结果 验证 了 经 过 训练 后 的 BP 网 络 性 能 符合 需求 。 对 于 包含 几 百 个 权 值 的 中 等 规 
模 的 前 向 网 络 ，Levenberg-Marquardt 算法 是 目前 最 快 的 训练 算法 ， 因 此 ， 用 new 企 函数 生 


成 的 网 络 采用 此 算法 作为 默认 训练 函数 。 
表 10-1 列 出 了 以 上 介绍 的 主要 训练 算法 以 及 MATLAB 对 应 的 函数 。 


表 10-1 主要 的 BP 网 络 训练 算法 及 其 MATLAB 函数 总 结 





说 明 







训练 算法 缩写 











带动 量 的 梯度 下 降 算法 





Hingd 寺 标准 梯度 下 降 算法 
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训练 算法 缩写 说 
aingda | 可 这 学 飞 率 柄 度 算法 
trainim Levenberg-Marquardt 算法 
Te | BGS 肌 直 全 法 

inm 弹性 梯度 算法 

mainscg Scaled 共生 梯度 算法 

traincgb Powell-Beale 芥 梯度 算法 
mincef Fletcher-Powell 共 否 梯度 算法 
aincgp PolakcRibitre 共 令 樟 度 算法 
rainoss 一 步 正 割 算法 






































标准 的 梯度 下 降 算法 的 训练 速度 通常 是 非常 慢 的 ， 为 了 保证 训练 过 程 的 稳定 性 ， 标 准 
的 梯度 算法 需要 低 学 习 速 率 ， 而 有 动量 的 学 习 算法 相对 来 说 速度 就 要 快 一 些 ， 因 为 它 能 够 
在 保持 训练 过 程 的 稳定 性 的 前 担 下， 选择 更 快 的 学 习 速率 。 这 两 种 方法 通常 只 用 在 递增 模 
式 的 训练 过 程 中 。 

对 于 中 小 规模 的 BP 神经 网 络 ， 最 好 采用 Levenberg-Marquardt 算法 ， 它 具有 最 快 的 收 
如 速度 和 较 低 的 存储 量 ， 但 是 如 果 存 储 空间 很 紧缺 的 话 ， 需 要 选择 其 他 类 型 的 快速 算法 。 
对 于 大 型 的 网 络 ， 最 好 选择 Scaled 共 罗 梯 度 算法 或 者 弹性 梯度 算法 。 

多 层 神经 网 络 克服 了 单 层 感知 器 和 线性 网 络 的 缺陷 , 可 以 对 任何 线性 或 非 线性 的 输 
入 、 答 出 关系 实现 逼近 。 然 而 ， 尽 管 经 过 训练 的 网 络 理论 上 可 以 正确 地 完成 任何 问题 
的 求解 ， 但 是 BP 训练 算法 却 有 可 能 无 法 找到 切合 问题 的 解 ,训练 有 可 能 会 陷入 局 部 极 
小 点 。 

对 于 一 个 非 线性 网 络 而 言 ， 选 择 一 个 合适 的 学 习 速 率 是 一 项 有 挑战 性 的 工作 ， 过 高 的 
学 习 速率 会 导致 学 习 过 程 的 不 稳定 。 相 反 ， 学 习 速率 过 低 有 会 导致 训练 过 程 消耗 过 长 的 时 
间 。 相 对 而 言 ， 线 性 网 络 学 习 速 率 的 选取 就 显得 更 加 容易 。 不 过 采用 快速 学 习 算法 ， 默 认 
的 学 习 速 率 值 的 表现 还 是 较 好 的 。 

此 外 ， 非 线性 网 络 的 误差 性 能 表面 要 比 线性 网 络 的 更 复杂 。 采 用 非 线性 传递 函数 的 多 
层 网 络 的 误差 性 能 表面 上 会 产生 多 个 局 部 极 小 点 。 采 用 梯度 下 降 算法 进行 训练 时 ， 解 可 能 
会 陷入 局 部 极 小 点 ， 这 与 训练 初始 点 的 选取 也 有 关 。 因 为 这 样 ， 所 以 在 发 现 BP 网 络 对 于 
确定 的 问题 通过 训练 得 到 的 不 是 正确 解 的 时 候 ， 需 要 重新 初始 化 网 络 ， 以 保证 最 终 能 够 得 
到 最 优 解 。 

BP 网 络 对 于 隐 层 中 的 神经 元 个 数 敏感 。 隐 层 中 神经 元 数目 太 少 ， 可 能 会 导致 训练 的 
不 适 性 ， 而 神经 元 数目 太 多 ， 有 可 能 导致 过 适 性 ， 也 就 是 说 每 一 个 点 都 符合 得 很 好 ， 但 是 
拟 合 曲线 却 在 各 个 点 之 间 振 荡 。 
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_BP 神经 网 络 设计 实例 


由 于 在 隐 层 中 采用 了 非 线性 传递 函数 ， 因 此 BP 神经 网 络 对 于 线性 问题 以 外 的 许多 问 
题 也 可 以 很 好 地 解决 ， 具 有 相当 广泛 的 应 用 。 下 面 对 其 用 实例 进行 介绍 。 


10.5.1 ”函数 逼近 


BP 网 络 采用 非 线性 传递 函数 ， 相 对 线性 网 络 具 有 更 强 的 拟 合 能 力 ， 因 此 对 于 现实 中 
遇 到 的 各 种 复杂 的 函数 波形 可 以 进行 很 好 的 逼近 。 


【 例 10-14】  BP 网 络 函数 逼近 实例 。 对 一 个 具有 一 定 采样 率 的 正弦 函数 用 BP 网 络 
来 和 逼 近 其 波形 。 
解 ，@@ 首先 定义 正弦 函数 ， 采 样 率 为 20Hz， 频 率 为 1Hz。 输 入 如 下 语句 

kx = 1; g% 设 定 正弦 信号 频率 

P [0:0.05:4]; 上 = sin(k*pi*p): 

ploc(P，t， 机 
xlabel(' 时 间 ' ) 


ylabel( ,输入 信号 ，) ， 
绘 出 的 曲线 如 图 10-18 所 示 。 











图 10-18 ”输入 正弦 信号 
针 用 newff 函数 生成 前 向 型 BP 网 络 ， 设 定 隐 层 中 神经 元 数目 为 8， 分 别 选择 隐 层 的 
传递 函数 为 tansig， 输 出 层 的 传递 函数 为 purelin， 学 习 算 法 为 trainim。 输 入 如 下 语句 ， 
net -= newff(minmax(p),[10,1] ,ft'tansig'，'purelin')，trainlm' )1 
对 生成 的 网 络 进行 仿真 并 作 图 显示 。 输 入 如 下 命令 ， 
Y1 = simtnet,p); 


种 0OEHRE 全 0 表征 = 全 
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绘制 的 曲线 如 图 10-19 所 示 。 














0 0 1 1 2 2 3 86 14 


图 10-19 生成 网 络 的 仿真 响应 


可 以 看 到 ， 逼 近 效 果 相差 是 很 远 的 。 
侠 下 面 对 网 络 进行 训练 ， 设 定 训练 误差 目标 为 le5， 最 大 适 代 次 数 为 300， 学 习 束 
率 为 0.05。 输 入 如 下 命令 


met .上 trainParam.lr=0.05) 
net .上 rainParam.epochs=300) 
net .trainParam.goal=le-5; 
Inet,tr]=train(net,p,t) 1 

















图 10-20 训练 过 程 中 网 络 误差 性 能 的 变化 


可 以 看 到 ， 网 络 训练 经 过 了 20 次 迭代， 就 达到 了 设 定 的 目标 要 求 。 
合 下 面 对 训 练 后 的 网 络 进行 仿真 ， 并 绘图 显示 。 输 入 如 下 命令 : 


Y2 = sim(net,p) 7 


plot(p，t，'-o'，p，y2，'-- 小 ; 
绘制 的 曲线 如 图 10-21 所 示 。 
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图 10-21 训练 后 的 网 络 响应 


可 以 看 到 ， 经 过 训练 后 的 网 络 的 响应 与 输入 输出 样本 吻合 得 非常 好 。 这 也 说 明 BP 神 
经 网 络 对 于 非 线性 函数 的 逼近 能 力 是 相当 好 的 。 


10.5.2 ”回归 分 析 


在 生产 和 科学 实验 中 ， 选取 的 数学 模型 主要 是 线性 回归 方程 形式 ， 采 用 回归 分 析 方 法 
确定 模型 的 参数 。 由 于 BP 网 络 可 对 任意 形状 的 函数 曲线 进行 逼近 ， 因 此 ， 可 以 采用 BP 
网 络 进行 回归 分 析 。 


【 例 10-15】 此 例 是 一 个 神经 网 络 应 用 于 医学 中 的 例子 ， 目标 是 设计 一 台 仪器 ， 能 够 
利用 光谱 分 析 的 数据 测定 血清 中 胆固醇 含量 。 现 共有 264 个 病人 的 血清 样本 ， 在 21 个 波 
长 上 进行 光谱 测量 ， 同 时 对 这 些 病人 进行 HDL、LDL、VLDL 胆固醇 含量 的 检测 。 

解 ; @@ 在 MATLAB 神经 网 络 工具 箱 中 包含 有 这 些 样本 数据 ， 首 先 利用 命令 load 对 其 进 
行 加 载 。 输 入 命令 : 


load choles_all; 


数据 加 载 完毕 后 ， 输 入 和 输出 向 量 P，! 出 现在 MATLAB 数据 区 。 

然后 ， 利 用 函数 newff 创建 网 络 。 设 定 网 络 输入 为 P，t， 生 成 含有 一 个 隐 层 的 BP 网 
络 ， 隐 层 中 包含 5 个 神经 元 ; 定义 网 络 首先 对 输入 标准 差 归 一 化 ， 设 定 最 大 比例 为 0.001 
以 实现 主 成 分 分 析 。 输 入 命令 : 


met = newftf(p, 必 ,5)， 


net .inputs{1] .processFcns = {'mapstd'，processpca 1 
net .inputs{1) .processParams{2] .maxfrac = 0.0017 
net .outputs{2)} .processFcns = {'mapstd']7 


全 接 下 来 ， 利 用 train 函数 对 网 络 进行 训练 。 输 入 如 下 命令 : 


[nec,cr]=train(net,P,) 
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利用 plotperform 命令 可 以 对 训练 过 程 中 网 络 误差 的 变化 进行 绘图 显示 。 输 入 命令 ， 


Plotperform(tr); 


绘 出 图 形 如 图 10-22 所 示 。 

















图 10-22 ”训练 过 程 中 网 络 误差 性 能 的 变化 


可 以 看 到 ， 在 11 次 迭代 之 后 ， 网 络 的 误差 性 能 达到 了 期 望 值 ， 因 此 训练 终止 。 

人 鲜 下 面 利 用 训练 过 的 网 络 对 输入 的 数据 样本 进行 仿真 ， 然 后 将 网 络 输出 和 相应 的 其 
望 输出 向 量 进行 线性 回归 分 析 。 因 为 有 三 组 输出 值 ， 因 此 需要 进行 三 次 线性 回归 ， 分 别 对 
应 hdl、ldl、vldl 线性 回归 。 输 入 如 下 命令 : 

Y = sim(net,p)， 

DPlotregression(t(1,:),y(1,:)) 


Plotregression(t( 
plotregression(t( 














图 10-23 hdl 线性 回归 结果 
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图 10-24 1dl 线性 回归 结果 








图 10-25 vidl 线性 回归 结果 


可 以 看 到 ， 图 10-23、10-24 中 的 期 望 响应 与 仿真 输出 回归 效果 较 好 ， 相 关系 数 都 在 
0.9 左右 ， 而 图 10.25 输出 则 与 期 望 值 吻合 得 不 是 很 好 ,相关 系数 只 有 0.54。 通 过 修改 网 络 
结构 ( 例如 增加 隐 层 神经 元 数目 )， 或 利用 其 他 训练 方法 ， 可 以 改善 网 络 运行 的 效果 。 


10.5.3 ”特征 识别 
利用 计算 机 进行 模式 识别 是 一 项 很 有 用 的 技术 ， 尤 其 是 利用 机 器 来 识别 图 形 符号 的 
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特征 ， 如 银行 支票 的 签字 ， 这 是 非常 省 时 省 力 的， 同时 避免 了 人 工 操作 可 能 出 现 的 很 多 
问题 。 





【 例 10-16】 ”利用 BP 网 络 进行 特征 识别 实例 。 设 计 并 训练 一 个 BP 网 络 ， 完成 26 个 
字母 的 图 像 识 别 。 
解 : (人 载 入 字母 表 。 英 文字 母 可 以 通过 5x7 像素 的 二 值 数字 图 像 来 表示 。 图 10-26 所 示 
为 字母 A 的 对 应 图 像 。 

将 5x7 个 像素 对 应 的 值 转化 为 一 维 向 量 ， 则 每 个 字母 对 应 的 向 量 含有 35 个 元 素 ， 从 
而 组 成 了 一 个 向 量 矩 阵 alphabet。 而 期 望 输出 向 量具 有 26 个 元 素 ， 该 字母 在 字母 表 中 所 处 
位 置 的 元 素 为 1， 其 他 位 置 的 元 素 为 0。 

例如 ， 字 母 A 在 字母 表 中 为 第 一 个 字母 ， 因 此 其 期 望 输出 向 量 为 [1,0,0,.…,0]。 下 面 载 
入 字母 表 。 输 入 命令 : 

clear 

[alphabet,targetsj = prprob; 

[R,Q] = size(alphabet); 

【S2,Q] = size(targets); 

其 中 prprob 文件 定义 了 26 个 字母 对 应 的 图 像 向 量 以 及 目标 向 量 。 由 于 现实 中 的 字符 
图 像 并 不 一 定 是 理想 的 ， 因 此 网 络 必须 具有 一 定 的 容错 能 力 。 含 有 噪声 的 字母 A 的 图 像 如 
图 10-27 所 示 。 





图 10-26 字母 A 的 图 像 图 10-27 含有 噪声 的 字母 A 图 像 


例 创建 网 络 并 初始 化 。 网 络 接收 35 个 布尔 数值 作为 输入 ， 也 即 输入 向 量 含有 35 个 
元 素 ， 网 络 输出 就 是 所 在 位 置 的 具有 26 个 元 素 ( 26 个 字母 ) 的 输出 向 量 。 对 于 正确 的 网 
络 ， 应 该 能 够 产生 与 输入 对 应 的 输出 响应 。 

同时 网 络 还 应 该 具有 一 定 的 容错 能 力 。 当 噪声 均值 为 0， 标 准 差 小 于 0.2 时 ， 网 络 应 
该 仍然 能 够 正确 地 识别 输入 字母 向 量 。 

利用 new 人 函数 设计 一 个 两 层 的 神经 网 络 ， 其 中 第 一 层 隐 层 中 含有 10 个 神经 元 ， 这 
个 值 是 根据 经 验 和 问题 复杂 度 的 估计 而 定 的 。 如 果 识 别 效果 不 理想 的 话 ， 可 以 进一步 增 
加 神经 元 的 数目 。 第 一 、 二 层 神经 元 均 采用 logsig 传递 函数 ， 对 应 的 网 络 结构 如 图 10-28 
所 示 。 
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图 10-28 BP 网 络 结构 
输入 下 列 命令 创建 网 络 : 


S1L = 10; 

net = newff (minmax(alphabet),[S1 S2],{'1ogsig' '1ogsig')，'traingdx'); 

net.LW{2,1}) = net.LW{I2,1)*0.017 

net .bf{2} = nect.bf2)*0.017 

侠 对 网 络 进行 训练 。 

设 定 网 络 训练 函数 以 及 训练 样本 向 量 ， 为 了 使 网 络 具 有 容错 能 力 ， 能 够 处 理 带 有 噪声 
的 输入 样本 ， 需 要 利用 理想 样本 和 噪声 样本 对 网 络 进行 训练 。 因 此 训练 过 程 这 样 进行 ; 首 
先 利用 理想 样本 向 量 进行 训练 ， 直 到 达到 期 望 的 误差 值 。 输 入 如 下 命令 : 

net .performFcn = 'Sse': 

net .krainParam.goal = 0.11; 

net .rainParam.epochs = 5000; 

net ,上 trainParam.mc = 0.95; 

P = alphabetc: 

T = targecs); 

[net,Er] = train(net,P,T) 


训练 过 程 中 网 络 误差 的 变化 情况 如 图 10-29 所 示 。 
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图 10-29 训练 过 程 中 网 络 误差 的 变化 
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合 建立 一 个 网 络 副本 ， 对 网 络 副 本 进行 含 噪声 的 样本 训练 , 设 定期 望 误差 为 0.6,， 最 
大 迭代 次 数 为 300。 输 入 命令 : 


netn = nety 
netn.crainParam.goal = 0.6; 
mnetn.trainParam.epochs = 300); 


定义 网 络 输入 样本 为 理想 样本 与 含有 随机 噪声 的 样本 合成 的 向 量 ， 然后 开始 对 网 络 训 
练 ， 重 复 训 练 10 次 ， 这 样 做 的 目的 是 使 得 训练 产生 的 网 络 既 能 够 识别 理想 输入 样本 ， 也 , 
能 够 识别 含 噪声 的 输入 样本 。 输 入 命令 : 


T = [targets targets cargets targets]; 
for pass = 1:10); 

fprintf('Pass = $.0f\n' ,pass); 

P = [alphabet，alphabet，... 
(alphabet + randn{R,Q)*0.1)，-... 
{alphabet + randn(R,Q)*0.2)1]; 

[netn,cr] = train(netn,P,T); 

end 


然后 再 次 进行 无 噪声 样本 的 训练 ， 这 样 做 的 目的 是 使 得 网 络 对 理想 信号 的 识别 更 为 迅 
速 。 输 入 命令 ， 


netn .trainParam.goal = 0.1; 
necn .trainParam.epochs = 500; 
P = alphabet; 
T = targetsi 





[netn,trj = train(netn,P,T) 1; 
但 最 后 利用 输入 样本 向 量 对 网 络 进行 仿真 ， 并 测试 输出 。 输入 命令 如 下 ， 
noise_range =- 0:.05:.5; s% 设 定 输入 噪声 大 小 

max_test = 100; 

necwork1 [7 





network2 = []， 
了 = targecsi; 


for noiselevel = noise_range 。$% 设 置 主 循环 
fprintf('Testing networxks with noise level of %.2f.\n'vnoiselevel); 
errorsl = 
errors2 = 0 





for i=1:max_test 


忆 = alphabet + randn(35,26) *noiselevel; # 添 加 噪声 
RAR = sim(nect,P) ; % 对 无 噪 样本 训练 网 络 进行 仿真 
RAR = compet (A) % 竞 争 输出 ， 获 得 二 值 字母 图 像 输 出 
errorsl = errorsl + sum(sum(abs(AA-T))) /2; 8 计算 误差 
an = sim(netn,P)， S% 对 含 噪 样本 训练 网 络 进行 仿真 
Ran = compet (An) s# 竞 争 输出 ， 获 得 二 值 字母 图 像 输 出 
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errors2 -= errors2 + sum(sum(abs(Ahn-T)))/ 2; 。 % 计 算 误差 
ena 
network1l = [network1l errorsl1/26/100]; s% 记 录 无 噪 样本 训练 网 络 误差 数据 
network2 = [necwork2 errors2/26/100]; % 记 录 含 噪 样本 训练 网 络 误差 数据 
end 
plot (noise_range,networkl*100,'--',noise_range,network2*100，* ) 1 


ticle(' 误 差 百分数 ' ) 7 
xlabel{ "噪声 水 平 ' ) ; 
ylabel('Network 1 - -Network 2 **')7 


最 终 绘 出 的 曲线 如 图 10-30 所 示 。 
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图 10-30 “字符 识别 误差 与 输入 噪声 水 平 的 关系 


图 10-30 中 ,虚线 表示 的 是 用 理想 样本 训练 的 网 络 ， 星 号 “+ 表示 的 是 用 噪声 样本 训 
练 的 网 络 。 可 以 看 到 ， 在 输入 噪声 水 平 低 于 0.1 的 情况 下 ， 两 个 网 络 都 可 以 很 好 地 完成 对 


字符 的 识别 ， 在 噪声 水 平 较 高 的 情况 下 ， 两 个 网 络 都 不 能 够 很 好 进 





行 字符 识别 ， 但 是 经 过 


噪声 样本 训练 后 的 网 络 ， 其 容错 能 力 比 未 经 过 噪声 样本 训练 的 网 络 要 强 。 如 果 希 望 网 络 具 


有 更 高 的 容错 性 ， 可 以 在 训练 中 增加 噪声 的 比重 。 


需要 说 明 的 是 ， 由 于 版 本 差异 ， 此 例 程 在 MATLAB 7.0 版 本 中 是 运行 无 误 的 ， 但 在 


MATLAB R2009b 版 本 中 执行 结果 ， 可 能 会 有 所 不 同 。 
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本 章 首先 介绍 BP 网 络 的 结构 和 学 习 规则 ,然后 结合 实例 介绍 如 何 利用 MATLAB 工具 


箱 函数 创建 、 训 练 BP 型 神经 网 络 。 
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1985 年 , Powell 提出 了 多 变量 插值 的 径 向 基 函 数 方法 ( Radial-based Function Method )。 
1988 年 , Broomhead 和 Lowe 在 此 基础 上 提出 了 径 向 基 神 经 网 络 , 也 就 是 RBF 神经 网 络 结 
构 。 径 向 基 神 经 网 络 采 用 高 斯 函数 等 径 向 基 函 数 作为 神经 元 传递 函数 ， 能 够 实现 非 线性 关 
系 的 映射 。 径 向 基 神 经 网 络 在 函数 逼近 、 时 间 序 列 分 析 、 非 线性 控制 、 模 式 分 类 、 图 像 处 
理 等 方面 有 很 广泛 的 应 用 。 

结构 上 ， 径 向 基 神 经 网 络 仍然 属于 多 层 前 向 型 神经 网 络 ， 通 常 由 隐 层 、 输 出 层 两 个 神 
经 元 层 组 成 。 径 向 基 神 经 网 络 相对 于 BP 神经 网 络 而 言 往往 需要 更 多 的 神经 元 ， 但 是 它 的 
训练 速度 更 快 ， 在 输入 向 量 样本 数目 较 多 的 情况 下 ， 径 向 基 网 络 的 效果 是 很 好 的 。 


基本 径 向 基 神 经 网 络 


径 向 基 神 经 元 通常 采用 径 向 基 传递 函数 ， 网 络 结构 上 通常 包含 两 层 神经 元 ， 第 一 层 为 
隐 含 的 径 向 基层 ， 第 二 层 为 输出 线性 层 。 本 节 我 们 将 对 其 神经 元 和 网 络 结构 进行 介绍 。 


11.1.1， 径 向 基 网 络 神经 元 模型 


图 11-1 给 出 了 一 个 具有 R 个 输入 的 径 向 基 神 经 元 模型 结构 图 。 图 中 每 一 个 输入 被 赋 
予 一 定 的 权 值 ， 与 偏差 求 和 后 作为 神经 元 传递 函数 的 自 变量 ， 神 经 元 的 输出 是 传递 函数 的 
输出 。 径 向 基 神 经 元 具有 多 种 不 同 的 传递 函数 ， 最 常用 的 传递 函数 是 高 斯 函数 。 

与 其 他 类 型 的 神经 元 有 所 不 同 的 是 ， 径 向 基 神 经 元 传递 函数 的 输入 是 权 值 向 量 和 输入 
向 量 之 间 的 向 量 距离 与 偏差 的 乘积 。 图 中 Ildist Il 于 示 的 是 权 值 与 输入 向 量 的 点 积 。 


输入 季 向 基 神 经 元 





=radbas( IIW-PINb ) 


图 11-1 径 向 基 网 络 神经 元 模型 示意 图 
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高 斯 型 径 向 基 神 经 元 传递 函数 的 表达 式 为 


radbas(D) 一 e 


图 11-2 是 此 传递 函数 的 图 形 。 





图 11-2 ”高 斯 型 径 向 基 神 经 元 传递 函数 


当 径 向 基 传递 函数 的 输入 为 0 时 ， 此 径 向 基 函 数 取得 其 最 大 值 1。 随 着 权 值 向 量 与 
输入 向 量 之 间 的 距离 的 减 小 ， 输 出 逐渐 增 大 。 因 此 ， 对 于 一 个 径 向 基 神 经 元 ， 当 输入 己 
与 权 值 w 完全 相等 时 ， 此 神经 元 的 输出 恰好 为 1。 

偏差 吕 的 作用 是 调节 径 向 基 神 经 元 的 灵敏 度 。 例 如 ， 如 果 一 个 神经 元 的 偏差 等 于 0.2， 
那么 对 于 输入 向 量 与 输出 向 量 w 距离 相差 8.326(0.8326/ 吃 的 情况 ， 其 输出 值 为 0.5。 


11.1.2 ， 径 向 基 神 经 网 络 结构 


径 向 基 网 络 包括 两 层 神经 元 , 第 一 层 是 由 8! 个 径 向 基 神 经 元 组 成 的 隐 层 ， 第 二 层 是 由 
3 个 线性 神经 元 组 成 的 输出 层 。 其 网 络 结构 如 图 11-3 所 示 。 
输入 科 向 共 神 经 元 层 线性 答 出 层 





相 f=radbas0IIWu -plb) az = purelin(LW2ia +b2) 


图 11-3 ” 径 向 基 神经 网 络 结构 


图 11-3 中 ，df 是 向 量 m 的 第 i 个 元 素 ， 7TW 岂 是 权 值 和 矩阵 了 W 岂 的 第 i 个 行 向 量 。 

及 为 输入 向 量 元 素 的 数目 。l dist ll 标号 的 输入 为 输入 向 量 P 和 输入 权 值 答 阵 TW' 
产生 的 输出 向 量 包含 S; 个 元 素 ， 其 中 各 个 元 素 是 输入 向 量 与 矩阵 TW'" 各 行 之 间 的 向 
量 距离 。 

偏差 向 量 刀 与 lldist ll 相 乘 的 结果 可 以 由 MATLAB 运算 符 “*” 得 到 ,该 运算 符 表 示 的 
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是 向 量 元 素 对 元 素 的 乘积 。 
前 向 网 络 的 第 一 个 神经 元 层 的 输出 可 以 表示 如 下 : 


af1)} = radbasCnetprod(disttnetIW{1,1j,p), neLbf1))) 


幸运 的 是 ， 实际 上 并 不 需要 输入 如 此 复杂 的 公式 以 获得 这 个 计算 结果 。 创建 网 络 时 所 
有 的 操作 细节 都 由 MATLAB 工具 箱 函 数 newrbe 或 newrb 直接 完成 ， 通 过 sim 函数 进行 仿 
真 即 可 得 到 输出 结果 。 

我 们 可 以 通过 跟踪 一 个 输入 向 量 器 与 输出 向 量 oz 的 关系 来 观察 网 络 是 怎样 工作 的 。 每 
一 个 径 向 基 神 经 元 层 的 神经 元 都 会 根据 输入 向 量 与 神经 元 权 值 向 量 的 距离 产生 一 个 输出 。 
因此 ， 如 果 径 向 基 神 经 元 权 值 矩阵 与 输入 向 量 训 相差 非常 大 ， 就 会 产生 接近 于 0 的 输出 ， 
对 于 线性 输出 层 神经 元 而 言 ， 这 些 接近 于 0 的 输入 值 是 可 以 忽略 的 。 而 如 果 径 向 基 神 经 元 
权 值 矩 阵 与 输入 向 量 比较 接近 ， 就 会 产生 接近 于 1 的 输出 ， 对 于 线性 输出 层 而 言 ， 这 些 接 
近 于 !1 的 输入 则 是 比较 重要 的 。 

实际 上 ， 如 果 一 个 径 向 基 神 经 元 的 输出 为 1， 而 其 他 所 有 的 径 向 基 神 经 元 输出 均 为 0、 
或 非常 接近 于 0 的 话 ， 线 性 神经 元 层 的 输出 就 完全 是 这 个 被 激活 为 1 的 神经 元 的 贡献 。 这 
是 一 种 极端 情况 。 典 型 的 情况 是 ， 一 部 分 神经 元 贡献 比较 大 ， 另 一 部 分 则 贡献 较 小 。 

现在 来 看 看 第 一 个 神经 元 层 具体 是 怎样 工作 的 。 每 一 个 神经 元 的 加 权 输 入 正 是 输入 向 
量 和 它 的 权 值 向 量 的 距离 ,该 距离 利用 lldistl 计 算得 到 ,也 就 是 说 每 个 神经 元 的 网 络 输入 是 
输入 向 量 与 权 值 向 量 的 对 应 元 素 乘积 之 和 ， 然 后 加 上 偏差 的 值 。 

在 MATLAB 中 ,这 可 以 由 函数 netprod 计算 得 到 。 每 个 神经 元 lldistl 的 输出 都 经 过 radbas 
函数 处 理 ， 形 成 最 终 的 输出 。 如 果 一 个 神经 元 的 权 值 向 量 与 输入 向 量 相等 的 话 ， 其 网 络 输 
入 就 为 0， 输出 就 为 1; 而 如 果 网 络 输入 为 1 的 话 ， 其 输出 就 为 0。 如 果 权 值 向 量 和 输入 向 
量 之 间 的 距离 等 于 散布 常数 spread 的 值 ， 则 传递 函数 输入 为 0.8326， 其 输出 就 为 0.5。 


概率 神经 网 络 是 径 向 基 神 经 网 络 的 一 种 ， 与 基本 径 向 基 神 经 网 络 的 不 同 在 于 它 的 第 二 
层 采 用 了 竞争 函数 作为 输出 传递 函数 。 概 率 神经 网 络 通常 用 于 模式 分 类 问题 。 

在 实际 应 用 中 ， 当 概率 神经 网 络 获得 一 个 输入 时 ， 第 一 层 神经 元 计算 输入 向 量 与 输入 
样本 向 量 的 距离 ， 并 产生 一 个 向 量 ， 此 向 量 的 各 个 元 素 表征 输入 向 量 与 输入 样本 向 量 的 接 
近 程度 。 

第 二 层 神经 元 将 与 输入 向 量 的 各 种 类 别 综合 起 来 ， 产 生 一 个 表征 概率 的 输出 向 量 。 最 
后 ， 一 个 竞争 型 ( compete ) 的 传递 函数 在 输出 端 选 择 具有 最 大 概率 的 输入 向 量 类 别 ， 产 
生 输 出 1， 而 其 他 类 别 的 输入 向 量 则 产生 输出 0。 其 网 络 结构 如 图 11-4 所 示 。 

R 为 输入 向 量 元 素 的 数目 ，@C 为 输入 目标 样本 的 数目 ， 也 是 第 一 层 神经 元 的 数目 ; 天 
是 输入 向 量 类 别 的 数目 ， 也 是 第 二 层 神经 元 的 数目 。 

假设 有 C 个 输入 向 量 与 目标 输出 向 量 对 ， 每 个 目标 向 量 有 K 个 元 素 。 目 标 向 量 中 仅 
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一 个 元 素 为 1， 其 余 的 全 为 0。 这样， 每 一 个 输入 向 量 与 此 天 类 中 的 一 类 相对 应 。 


输入 径 向 基 神 经 元 层 竞争 神经 元 层 
ee 





of = radbas CIW p1b) l =compet(LWza' ) 


图 11-4 ”概率 神经 网 络 结构 


图 11-4 中 ，oql 是 向 量 a' 的 第 1 个 元 素 ， 7W" 是 权 值 矩 阵 7W ”的 第 1 个 行 向 量 。 将 
概率 神经 网 络 的 第 一 层 径 向 基 神 经 元 的 输入 权 值 短 阵 TW'… 设 为 2 个 训练 样本 对 的 转 置 已。 
当 网 络 获得 输入 时 ， 由 Il dist li 计算 得 到 一 个 向 量 ， 此 向 量 的 元 素 表征 输入 向 量 与 训练 样本 
的 接近 程度 。 然 后 该 向 量 元 素 与 偏差 向 量 0 的 元 素 逐 个 相 乘 ， 结 果 传 递 给 radbas 函数 。 经 
过 radbas 计算 之 后 ， 视 输入 向 量 与 哪 一 个 样本 向 量 最 接近 ， 则 a': 中 对 应 的 元 素 就 接近 于 1。 
如 果 输 入 向 量 与 一 系列 训练 样本 向 量 都 接近 的 话 ， 则 对 应 的 几 个 元 素 都 接近 于 1。 

概率 神经 网 络 的 第 二 层 权 值 和 矩阵 工 W'? 设 为 期 望 目标 响应 To 权 值 矩 阵 的 每 一 个 行 向 
量 只 有 一 个 元 素 为 1， 对 应 着 一 类 输入 ， 其 余 元 素 均 为 0， 然 后 计算 矩阵 乘积 zr'。 最 后 ， 
第 二 层 神 经 元 采用 竞争 传递 函数 计算 吧 ， 对 其 中 最 大 的 元 素 输出 为 1， 其 余 元 素 取 为 0。 
从 而 ， 概 率 神经 网 络 就 完成 了 对 输入 向 量 的 划分 。 


E 一 义 回归 神经 网 络 


广义 回归 神经 网 络 ( GRNN ) 是 由 一 个 径 向 基层 与 一 个 特殊 线性 层 构成 的 神经 网 络 ， 
通常 被 用 来 做 函数 逼近 。GRNN 的 网 络 结构 如 图 11-5 所 示 ， 它 在 网 络 结构 上 与 标准 的 径 向 
基 神 经 网 络 有 一 些 细微 的 差别 。 


输入 和 向 基层 特殊 线性 层 
PE 





=radbas(ITW-p12) 王 = Purelint m) 


图 145 广义 回归 神经 网 络 结构 
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图 11-5 中 ， 中 是 向 量 的 第 1 个 元 素 ;，7 厂 凡是 权 值 矩阵 7W 的 第 ;个 行 向 量 ，R 


为 输入 向 量 元 素 的 数目 ，@ 为 输入 输出 样本 的 数目 ， 也 是 第 一 、 二 层 神经 元 的 数目 。 
此 外 ， 图 中 “nprod” 方 框 的 输出 为 的 8 维 向 量 玉 ， 其 中 的 元 素 是 权 值 矩阵 W24 各 
行 与 输入 向 量 w 的 点 积 ， 结 果 根 据 ai: 的 元 素 和 进行 归 一 化 。 假 设 
Lw{2,1)= [1 -2;3 4;5 6]; 
atf1) = [0.7;0.3]， 


则 有 : 
aout =,.normprod(LW{2,1},afll) 

aocout = 0.1000 

3.3000 
5.3000 

广义 回归 神经 网 络 的 第 一 层 与 通常 的 径 向 基 神 经 网 络 相同 。 其 神经 元 数目 与 输入 目标 
向 量 对 忆 的 个 数 相等 。 第 一 层 的 权 值 设 为 忆 ， 偏 差 站 设 为 0.8326/spread 的 列 向 量 。 由 用 
户 选 择 spread 矩阵， 应 该 使 得 输入 向 量 与 神经 元 权 值 向 量 的 距离 为 0.5。 

此 外 ， 广 义 回归 神经 网 络 第 一 层 神经 元 的 功能 也 与 通常 的 径 向 基 神 经 元 相同 。 每 个 
神经 元 的 加 权 输 出 结果 就 是 由 lldistl 计 算得 到 的 输入 向 量 与 权 值 向 量 的 距离 。 每 一 个 神经 
元 传递 函数 的 输入 是 偏差 与 加 权 后 输入 向 量 的 乘积 ， 输 出 则 是 radbas 函数 计算 得 到 的 
结果 。 

如 果 神 经 元 的 权 值 向 量 与 输入 向 量 的 转 置 相等 ， 则 其 加 权 后 的 结果 为 0， 也 即 传递 函 
数 输入 为 0， 输 出 结果 为 1。 如 果 权 值 向 量 和 输入 向 量 之 间 的 距离 等 于 散布 常数 Spread 的 
值 ， 则 传递 函数 输入 为 0.8326， 其 输出 就 为 0.5。 

广义 回归 神经 网 络 的 第 二 层 包含 的 神经 元 数目 与 输入 向 量 /目标 向 量 的 数目 一 样 , 但 是 
权 值 和 矩阵 LW2”" 的 值 被 设 定 为 T。 

假定 输入 向 量 为 接近 于 样本 输入 向 量 的 忆 ， 这 个 输入 六 产 生 的 第 一 层 输出 才 接 近 于 
1, 这 使 得 第 二 层 的 输出 接近 于 目标 向 量 中 的 占 的 值 , 更 大 的 散布 常数 会 使 得 输入 向 量 有 更 
大 的 变动 范围 ， 在 此 范围 内 第 一 层 神经 元 会 产生 较 大 的 输出 。 如 果 散 布 常数 较 小 ， 则 径 向 
基 函 数 的 曲线 就 会 更 陡 ， 以 致 与 权 值 向 量 最 接近 的 输入 向 量 所 产生 的 输出 会 远大 于 其 他 的 
输入 ， 此 时 网 络 就 只 对 最 接近 权 值 向 量 的 输入 有 响应 。 

随 着 散布 常数 逐渐 增 大 , 径 向 基 函 数 的 斜率 会 变 得 越 来 越 平坦 ， 这 时 将 会 有 更 多 的 
神经 元 对 输入 向 量 有 响应 ， 此 时 网 络 的 作用 就 相当 于 与 输入 向 量 接近 的 样本 向 量 的 加 


径 向 基 网 络 的 MATLAB 实现 


本 节 我 们 通过 实例 对 径 向 基 神 经 网 络 、 概 率 神经 网 络 以 及 广义 回归 神经 网 络 相关 的 
MATLAB 工具 箱 函 数 进 行 介绍 。 
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11.4.1 ， 径 向 基 神 经 网 络 的 精确 创建 


在 MATLAB 中 ， 通 过 调用 函数 newrbe 可 以 精确 地 生成 一 个 径 向 基 神 经 网 络 ， 此 函数 
对 于 给 定 的 训练 向 量 能 够 生成 一 个 零 误 差 的 网 络 对 象 。 其 调用 格式 如 下 : 


net = newrbe,t spread) 

其 中 ，P、L 分 别 为 输入 与 输出 样本 向 量 ，spread 为 径 向 基 神 经 元 层 的 散布 常数 。 该 函 
数 返 回 的 网 络 对 象 对 于 给 定 的 输入 忆 具 有 精确 的 输出 响应 to 

newrbe 函数 生成 的 神经 元 输入 与 咏 中 向 量 个 数 相等 ， 第 一 个 层 神 经 元 权 值 设 为 m。 例 
如 ， 有 C 个 输入 向 量 ， 就 会 有 OC 个 神经 元 。 因 此 ， 网 络 中 有 一 个 具有 radbas 传递 函数 的 
径 向 基 神 经 元 层 ， 能 够 对 不 同 的 输入 向 量 起 到 检测 的 作用 。 

第 一 层 径 向 基 神 经 元 层 的 偏差 均 被 设置 为 0.8326/spread。 也 就 是 说 ， 对 于 加 权 后 的 绝 
对 值 大 小 等 于 spread, 则 径 向 基 函 数 的 输出 为 0.5， 这 决定 了 网 络 会 响应 的 输入 向 量 范围 的 
大 小 。 

如 果 spread 的 值 为 4， 则 径 向 基 神 经 元 只 有 对 那些 与 权 值 向 量 距离 小 于 4 的 输入 向 量 
才 会 产生 大 于 或 等 于 0.5 的 响应 。 此 外 ， 散 布 常数 spread 应 该 足够 的 大 ， 以 使 得 神经 元 能 
够 对 整个 输入 空间 产生 响应 。 

生成 的 网 络 第 二 层 为 线性 神经 元 层 ， 其 权 值 TW” 以 及 偏差 咏 对 于 前 一 层 的 输出 e， 
应 当 满足 下 面 的 线性 方程 : 

[Wi2,1} bt2]* [A{1j; ones] =T 
其 中 ，W{2.1}、bf2}、A{1) 分 别 是 权 值 TW 2 、 偏 差 六 ， 以 及 第 一 层 输出 we 的 对 应 


MATLAB 代码 ，T 为 目标 响应 ， 而 ALlj 和 T 都 是 已 知 的 ， 所 以 可 以 应 用 下 面 的 公式 来 计 
算 第 二 层 权 值 和 偏差 ， 计 算 结 果 具 有 最 小 的 均 方 误差 ， 
Wb =T/[P; ones(LQ)] 

此 处 ，Wb 和 矩阵 包含 权 值 与 偏差 ， 偏 差 位 于 矩阵 的 最 后 一 列 ， 其 均 方 误差 始终 为 0， 
解释 如 下 。 

此 定 解 问题 具有 C 个 约束 ， 但 是 有 C +1 个 待 求解 变量 ， 包 括 C 个 径 向 基 神 经 元 的 C 
个 权 值 ， 以 及 一 个 偏差 ;而 一 个 有 C 个 约束 、 而 变量 个 数 大 于 C 的 线性 问题 有 无 限 个 解 。 
这 也 就 是 newrbe 函数 能 够 以 零 误差 实现 对 输入 和 输出 样本 向 量 分 类 的 原因 。 

因此 ， 利 用 newrbe 函数 能 够 生成 一 个 对 于 给 定 的 训练 样本 向 量具 有 零 误差 的 网 络 。 
唯一 的 条 件 是 需要 给 出 一 个 足够 大 的 散布 常数 spread， 以 使 得 神经 元 响应 的 输入 范围 能 够 
覆盖 足够 大 的 区 域 。 这 样 对 于 任意 时 刻 的 任意 输入 ， 总 有 几 个 径 向 基 神 经 元 能 够 产生 较 大 
的 响应 输出 。 这 样 会 使 得 网 络 传递 函数 曲线 更 加 光滑 ， 能 够 更 好 地 综合 反映 不 同 于 样本 向 
量 的 新 的 输入 向 量 。 不 过 ，spread 常数 也 不 能 够 太 大 ， 以 致 各 个 神经 元 都 具有 完全 重 登 的 
输入 向 量 响应 区 域 ， 反 而 会 造成 精度 的 问题 

需要 指出 的 是 , newrbe 函数 所 生成 的 神经 网 络 隐 层 中 神经 元 的 数目 与 样本 输入 向 量 的 
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数目 一 样 多 。 因 此 ， 在 样本 输入 向 量 数目 非常 多 的 场合 ， 应 用 newrbe 函数 就 不 合适 了 。 


11.4.2 ”更 有 效 的 径 向 基 神 经 网 络 创建 


采用 MATLAB 工具 箱 提供 的 函数 newrb 可 以 以 送 代 的 方式 生成 一 个 径 向 基 神 经 网 络 。 
在 网 络 的 创建 过 程 中 ， 神经 元 会 不 断 地 加 入 到 网 络 之 中 ， 直到 均 方 误差 下 降 到 期 望 的 误差 
之 下 ， 或 者 网 络 达到 最 大 神经 元 数目 为 止 。newrb 函数 的 调用 方式 如 下 


net = newrbp, 上 + goal, spread) 

其 中 ，P，L 分 别 为 输入 与 输出 样本 向 量 ， Spread 为 径 向 基 神经 元 层 的 散布 常数 ，goal 
为 设 定 的 网 络 误差 目标 。 该 函数 返回 的 网 络 对 象 对 于 给 定 的 输入 总 具有 输出 响应 !， 误 差 
精度 在 goal 以 内 。 

newrb 函数 与 newrbe 相似 ， 不 同 之 处 在 于 ，newrb 采用 每 次 添加 一 个 神经 元 的 方式 工 
作 。 每 次 迭代 时 ， 利用 输入 向 量 中 对 降低 网 络 输出 误差 最 有 效 的 那 一 个 来 生成 一 个 径 向 基 
神经 元 。 

随后 检查 新 生成 网 络 的 误差 ， 如 果 足 够 小 的 话 ，newrb 函数 就 结束 ， 否 则 ， 继 续 添加 
新 的 神经 元 。 这 个 过 程 会 持续 到 网 络 达到 设 定 的 误差 目标 ， 或 者 网 络 达到 最 大 神经 元 数目 
为 止 。 

同 newrbe 函数 一 样 ， 应 用 newrb 函数 也 要 小 心地 选择 散布 常数 ， 既 要 大 到 使 得 神经 
元 产生 响应 的 输入 范围 能 够 覆盖 足够 大 的 区 域 ， 同时 也 不 能 太 大 ， 而 使 各 个 神经 元 都 具有 
重大 的 输入 向 量 响应 区 域 。 

为 什么 不 用 径 向 基 神 经 网 络 取代 标准 的 前 向 型 网 络 呢 ? 原因 是 ， 即 使 采用 最 有 效 的 方 
法 设计 径 向 基 神 经 网 络 ， 相 比 使 用 tansig 或 logsig 传递 函数 的 前 向 型 神经 网 络 ， 其 隐 层 也 
需要 更 多 的 神经 元 。 

这 是 因为 sigmoid 神经 元 能 够 对 输入 空间 中 的 较 大 范围 产生 响应 ， 然 而 radbas 神经 元 
只 能 够 对 输入 空间 中 相对 比较 小 的 范围 产生 响应 。 结 果 是 ， 输入 空间 越 大 { 也 即 输入 向 量 
越 多 ， 或 者 说 输入 向 量变 动 范围 越 大 )， 网 络 所 需要 的 radbas 神经 元 就 越 多 。 

不 过 好 的 方面 是 ， 设计 一 个 径 向 基 神 经 网 络 通常 所 需要 的 时 间 要 比 设计 一 个 sigmoid 
线性 神经 网 络 要 短 ， 并 且 有 时 所 需 的 神经 元 数目 也 更 少 。 


11.4.3 ”概率 神经 网 络 的 创建 


MATLAB 神经 网 络 工具 箱 提供 了 函数 newpnn 用 于 创建 一 个 概率 神经 网 络 , 下 面 举例 
说 明 。 

【 例 11-1】 概率 神经 网 络 创建 实例 。 给 定 7 个 输入 和 目标 响应 样本 向 量 , 应 用 newpnn 
函数 生成 一 个 与 之 对 应 的 概率 神经 网 络 。 
解 ，@ 首先 定义 输入 与 目标 响应 样本 向 量 对 。 输 入 命 


P= [00;11;03;1 4;3 1;4 1;4 3]， 
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me=Ill22333]， 
输出 结果 为 : 


P= 0 1 0 1 3 4 4 
0 1 于 4 1 1 
ze =1 1 2 5 3 和 3 


合 我 们 需要 将 序号 转换 为 向 量 ， 这 可 以 通过 ind2vec 函数 来 完成 。 输 入 命令 : 
T = ind2vec(Tc)， 
输出 结果 为 


T = 
(1,1) 
(1,2) 
(2,3) 
(2，4) 
(3，5) 
(3，6) 
3 和 浓 


侠 现在 可 以 通过 newpnn 函数 建立 概率 神经 网 络 并 对 其 进行 仿真 了 ， 仿真 输入 设 定 
为 忆 ， 需 要 将 向 量 格式 的 输出 了 转换 为 标量 格式 Yco 在 命令 行 输入 : 





PPPPPn 


net = newpnn(P,T) 7 
Y = sim(net,P); 
Yc = vec2ind(Y) 


输出 结果 为 : 

xce= 1 1 2 2 ，: 当 3 

国 我 们 也 可 以 尝试 对 样本 向 量 以 外 的 输入 进行 分 类 ， 例如 对 于 下 面 的 输入 向 量 P2， 
进行 仿真 。 输 入 命令 ， 


P2 = [14;01;5 2]'， 
Y = sim(net,P2) 1 
Yc = vec2ind(Y) 


得 到 的 结果 为 

pP2=-1 0 5 
4 1 2 

Yc =2 和 


结果 是 正确 的 ， 因为 仿真 输入 的 向 量 确实 分 别 与 样本 输入 的 2，1， 3 类 比较 接近 。 网 
络 能 够 正确 地 对 不 同 于 输入 样本 的 向 量 进行 分 类 。 


11.4.4 “广义 回归 神经 网 络 的 创建 
利用 MATLAB 工具 箱 函数 newgrmn 可 以 创建 一 个 广义 回归 神经 网 络 。 下 面 举例 说 明 。 
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【 例 11-2】 广义 回归 神经 网 络 创建 实例 。 给 定 输入 和 目标 响应 样本 向 量 , 应 用 newgrnn 
函数 生成 一 个 与 之 对 应 的 GRNN 神经 网 络 。 
解 : 首先 定义 输入 与 目标 响应 样本 向 量 。 输 入 命 


P 
: 


[4 5 6]; 
[1.5 3.6 6.7]; 


然后 创建 GRNN 神经 网 络 。 输 入 命 
net = newgrnn(P,T); 


对 网 络 进行 仿真 。 输 入 命令 ， 


1 


P = 4.5; 

v = sim(net,P)， 
输出 结果 为 : 

v = 3.0111 


以 上 就 完成 了 一 个 简单 GRNN 神经 网 络 的 创建 和 仿真 。 


径 向 基 网 络 可 以 应 用 于 函数 逼近 、 模 式 分 类 等 诸多 方面 。 这 一 节 我 们 将 对 其 应 用 实例 
进行 介绍 。 


11.5.1， 径 向 基 网 络 函数 逼近 


【 例 11-3】 径 向 基 网 络 函 数 逼 近 实例 。 应 用 newrb 函数 生成 一 个 径 向 基 神 经 网 络 ， 

对 给 定 的 输入 与 输出 数据 点 集 关系 进行 函数 拟 合 。 

解 ， 人 @ 定义 输入 和 输出 向 量 ， 共 21 对 ， 并 作 图。 输入 如 下 命令 : 

P = -1:.1:1; 

芝 .9602 -.5770 -.0729 .3771 .6405 .6600 .4609 ... 
.1336 -.2013 -.4344 -.5000 -.3930 -.1647 .0988 ... 
.3072 .3960 .3449 .1816 -.0312 -.2189 -.3201]) 

plot (PT，+ 7) 

title(' 训 练 样本 ( Training Vectors ) ') ; 

xlabel ( ' 输 入 样本 向 量 { Input Vector P) '); 

ylabel(' 目 标 向 量 ( Target Vector T) '); 


绘 出 的 曲线 如 图 11-6 所 示 。 

人 @ 对 这 21 对 输入 、 输 出 样本 点 进行 拟 合 ， 可 以 通过 径 向 基 网 络 实现 。 径 向 基 网 络 为 
两 层 结 构 ， 第 一 层 为 径 向 基 神 经 元 隐 层 ， 第 二 层 为 线性 输出 层 。 

创建 径 向 基 神 经 网 络 ， 并 绘图 显示 其 径 向 基 传递 函数 。 输 入 如 下 命令 ， 


P = -3:.1:3; 
a = radbas(p) 7 
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目标 向 量 (Target Vector T)》 
忆 
十 
十 








1 06 06 0 02 04 06 06 1 


04 -02 
输入 样本 向 量 《〈Input VectorP) 
图 11-6 ”输入 输出 样本 向 量 


Blot (P,a) 

title(' 径 向 基 传递 函数 ' ) ; 
xlabel(' 输 入 P')， 
ylabel(' 输 出 a') 7 


绘 出 的 图 形 如 图 11-7 所 示 。 














径 向 基 传递 函数 
09 
08 | 
o7 
06 
时 o5 
04 
03| ] 
02 | 
01 
多 2 二 了 1 2 3 
输入 p 


图 11-7 径 向 基 神 经 元 传递 函数 


侠 隐 层 中 的 各 个 神经 元 的 权 值 和 偏差 决定 了 径 向 基 函 数 曲 线 的 宽度 和 位 置 ， 而 输出 
层 各 个 线性 神经 元 对 径 向 基 神 经 元 的 输出 进行 加 权 求 和 。 

如 果 每 一 层 的 权 值 和 偏差 值 都 正确 ， 网 络 将 在 期 望 的 精度 内 实现 对 函数 的 拟 合 。 如 图 
11.8 所 示 ， 下 面 以 三 条 曲线 为 径 向 基 传 递 函数 曲线 ， 三 条 曲线 相 加 得 到 对 输入 、 输出 样本 
的 拟 合 曲线 ( 虚线 ) 。 输 入 命令 : 
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a2 = radbas(p-1.5); 

a3 = radbas(p+2) 1 

ad =a+a2rl+a3*0.5; 

plot (p,a, 'b-',p,a2,'b-',p,a3a,'b-'vp,a4,m--') 
title(' 径 向 基 传递 函数 加 权 和 ' ) ; 
xlabel(' 输 入 p')7 
ylabel(' 输 出 a') 7 





径 向 基 传递 函 数 加 权 和 








图 11-8 径 向 基 传递 函数 加 权 和 


在 上 面 的 步骤 中 , 我 们 通过 直接 指定 3 个 径 向 基 传递 函数 的 加 权 求 和 , 对 已 和 了 进行 
了 初步 的 逼近 ， 可 以 看 到 ， 这 样 逼 近 的 效果 是 粗糙 的 。 
人 下 面 应 用 函数 newrb， 快 速 地 创建 一 个 径 向 基 神 经 网 络 ， 并 且 通过 预先 设 定期 望 
的 均 方 误差 以 及 散布 常数 ， 可 以 以 任意 给 定 的 精度 对 函数 进行 逼近 。 输 入 命令 ; 
0.02; # 期 望 均 方 误差 
1; 。s% 散布 常数 
met = newrb(P,T,eg,sc); 
输出 结果 为 : 
NEWRB，neurons = 0，MSE = 0.176192 


@@ 为 了 查看 网 络 的 性 能 ， 可 以 重新 仿真 ， 并 对 训练 结果 重新 绘图 显示 。 输 入 命令 ， 


plLot(P,T，'+') 

xlabel('Input ') 7 

= -13:-01317 

Y = sim(net,X) 

holda on 

P1lot (X,Y) ， 

holda off7 

legend({ ' 目 标 向 量 ' ，' 网 络 输出 ' } ) 


绘图 结果 如 图 11-9 所 示 。 
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图 11-9 ”网络 输 出 与 目标 向 量 比较 


图 11-9 中 ， 加 号 “+” 代 表 的 点 为 期 望 的 目标 输出 ， 而 曲线 为 径 向 基 拟 合 曲线 。 可 以 
看 到 ， 产 生 的 径 向 基 神 经 网 络 对 期 望 的 输入 、 输 出 样本 对 拟 合 得 相当 好 。 


11.5.2 ”散布 常数 的 影响 之 欠 交 码 情 形 


在 前 面 的 章节 中 曾经 提 过 ， 散 布 常数 的 选择 对 于 径 向 基 神 经 网 络 的 创建 是 有 很 大 影响 
的 ， 如 果 散 布 常数 选择 不 当 ， 会 造成 网 络 中 神经 元 响应 区 域 不 能 覆盖 整个 输入 范围 ， 或 者 
交 午 区 域 过 大 导致 重复 响应 ， 因 而 造成 网 络 功能 的 不 适 性 或 者 欠 适 性 ， 这 一 节 我 们 举例 说 
明 因 为 由 于 散布 常数 选取 不 当 ， 导 致 网 络 神经 元 响应 欠 交 鸽 对 网 络 性 能 的 情形 。 

【 例 11-4】 ” 欠 交 矢 情 形 的 散布 常数 影响 实例 。 对 【11-3】 中 给 定 的 输入 、 输 出 数据 
点 集 ， 选 择 很 小 的 散布 常数 ， 创 建 径 向 基 神 经 网 络 进行 函数 拟 合 。 
解 ， @@ 定义 输入 和 输出 向 量 ， 共 21 对 数据 ， 并 作 图 。 输 入 如 下 命令 : 


P 
蒜 





-1:.1:1; 

[-.9602 -.5770 -.0729 .3771 .6405 .6600 .4609 .…- 
.1336 -.2013 -.4344 -.5000 -.3930 -.1647 .0988 .…. 
.3072 .3960 .3449 .1816 -.0312 -.2189 -.3201]7 
DPLoE(P,T，' + ) 7 

title(' 训 练 样本 ( Training Vectors) ')， 

xlabel (' 输 入 样本 向 量 ( Input Vector P) '); 

ylabel (' 目 标 向 量 ( Target Vector T) ') 


绘 出 的 曲线 如 图 11-10 所 示 。 
全 利用 newrb 函数 快速 创建 径 向 基 网 络 ， 对 P、7 函数 关系 进行 逼近 。 此 处 函数 参 
数 中 预先 设 定 的 期 望 均 方 误差 以 及 散布 常数 都 选择 非常 小 的 数 。 输 入 如 下 命令 : 


0.02; % 期 望 均 方 误差 
.01; s 散布 常数 


eg 
sc 
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net = newrb(P,T,eg,sc)y 
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图 11-10 ”输入 与 输出 样本 向 量 


得 到 输出 为 : 


NEWRB，mneurons = 0，MSE = 


0.176192 


为 查看 网 络 的 性 能 ， 用 sim 函数 对 其 进行 仿真 ， 并 对 训练 结果 重新 绘图 显示 。 输 入 


命令 ， 


=-1:.01:1; 
Y=sim(net,X) 7 
hold ony 
Plot (X,Y) 7 
hold off; 


绘 出 的 图 形 如 图 11-11 所 示 。 
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图 11-11 


06 -06 


1 


02 


0 


02 


04 


06 


08 


1 


Input Vector P 
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图 11-11 中 , 加 号 “+” 代 表 的 点 为 期 望 的 目标 输出 ， 曲 线 为 径 向 基 拟 合 曲线 。 可 以 看 
到 ， 由 于 散布 常数 选择 得 太 小 ， 产 生 的 径 向 基 神 经 网 络 对 期 望 的 输入 、 输 出 样本 的 拟 合 曲 
线 中 出 现 了 很 多 不 应 有 的 尖峰 ， 这 种 拟 合 的 结果 被 称 为 过 适 性 。 如 果 选 择 一 个 大 小 合适 的 
散布 常数 ， 则 不 会 出 现 这 样 的 结果 。 


11.5.3 ”散布 常数 的 影响 之 过 交 码 情形 


与 上 例 相 反 ， 如 果 散 布 常数 过 大 的 话 ， 会 导致 网 络 中 神经 元 响应 区 域 过 交 短 ， 造 成 网 
络 的 欠 适 性 。 这 一 节 我 们 举例 说 明 因为 散布 常数 选取 过 大 导致 网 络 神经 元 响应 过 于 交 乔 对 
网 络 性 能 造成 的 影响 。 


【 例 11-5】 “过 交 杜 情形 的 散布 常数 影响 实例 。 对 【 例 11-3 】 中 给 定 的 输入 、 输 出 数 
据点 集 ， 选 择 很 大 的 散布 常数 ， 创 建 径 向 基 神 经 网 络 进行 函数 拟 合 。 
解 ，@ 定义 输入 、 输 出 向 量 ， 共 21 对 数据 ， 并 作 图 。 输 入 如 下 命令 ， 


P = -1:.1:17 

m =- [-.9602 -.5770 -.0729 .3771 .6405 .6600 .4609 .…: 
.1336 -.2013 -.4344 -.5000 -.3930 -.1647 .0988 .. 
.3072 .3960 .3449 .1816 -.0312 -.2189 -.3201]) 

ploc(P,T，+ 9) 1 

title(' 训 练 样本 ( Training Vectors ) '); 

xlabel (' 输 入 样本 向 量 ( Input Vector P) '); 

ylabel (' 目 标 向 量 ( Targec Vector T) ') 7 


绘 出 的 曲线 如 图 11-12 所 示 。 
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图 11-12 输入、 输出 样本 向 量 





全 利用 newrb 函数 快速 创建 径 向 基 网 络 ， 对 已、T 函数 关系 进行 逼近 。 此 处 函数 参 
数 中 预先 设 定 的 期 望 均 方 误差 以 及 散布 常数 都 选择 非常 大 的 数 。 输 入 如 下 命令 : 


238 = 入 
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eg = 0.02; % 期 望 均 方 误差 
sc =100; % 散布 常数 
net = newrb(P,T,eg,sc): 
得 到 输出 为 : 
NEWRB，mneurons = 0，MSE = 0.176192 
为 查看 网 络 的 性 能 ， 用 sim 函数 对 其 进行 仿真 ,并 重新 绘图 显示 训练 结果 。 输入 命令 ， 


X=-1:.01:17 
Y=sim{net,X) ; 
hola on; 
ploct (X,Y) 
holdq off; 


绘 出 的 图 形 如 图 11-13 所 示 。 
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图 11-13 ”散布 常数 过 大 时 径 向 基 神经 网 络 函数 逼近 的 结果 


图 11-13 中 ， 加 号 “+” 代 表 的 点 为 期 望 的 目标 输出 ， 曲 线 为 径 向 基 拟 合 曲线 。 可 以 看 
到 ， 产 生 的 径 向 基 神 经 网 络 不 能 对 期 望 的 输入 、 输 出 样本 对 准确 地 拟 合 ， 拟 合 曲线 的 误差 
很 大 ， 这 样 的 结果 被 称 为 不 适 性 ， 这 是 散布 常数 选择 过 大 造成 的 结果 。 


11.5.4 ”广义 回归 网 络 函 数 逼 近 
广义 回归 神经 网 络 ( GRNN ) 通常 被 用 来 做 函数 逼近 ， 这 一 节 对 其 举例 进行 说 明 。 
【 例 11-6】 广义 回归 网 络 函 数 逼近 实例 。 对 给 定 的 输入 、 输 出 数据 点 集 ， 创 建 GRNN 
径 向 基 神 经 网 络 ， 并 进行 函数 拟 合 。 
解 : @@ 定义 输入 、 输 出 向 量 ， 并 作 图 。 输 入 如 下 命 


P=[IL12345678]; 
了 [01232121]， 
plot(P,T，' .markersize',30) 


下 
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axis([0 9 -1 4]) 
title(' 输 入 输出 样本 ' ) 
xlabel('P') 
Ylabel('T') 


绘 出 的 图 形 如 图 11-14 所 示 。 





葡 入 输出 样本 











图 1-14 输入 、 输 出 样本 向 量 


全 利用 newgmn 函数 创建 广义 回归 径 向 基 神经 网 络 ， 对 已 ， 了 函数 关系 进行 逼近 。 
选取 的 散布 常数 spread 略 小 于 输入 向 量 之 间 的 距离 1。 散 布 常数 比较 小 ， 对 输入 、 输 出 样 
本 点 的 拟 合 会 比较 好 ， 但 光滑 度 会 差 一 些 。 输 入 如 下 命令 : 

spread = 0.7; 

net = newgrnn (P,T,spread) 7 

有 RA = sim(net,P); 

hola on 

outputline = plot(P,R,'o'，'markersize',10, "color' [1 0 0]1); 

title(' 网 络 输出 与 样本 比较 ') 

xlabel('P') 

ylabelt'T and A') 

绘 出 的 图 形 如 图 11-15 所 示 。 

合 在 图 11-15 中 ,实心 圆 点 代表 输出 样本 点 ， 空心 圆 点 代表 创建 的 GRNN 仿真 的 输 
出 。 可 以 看 到 ， 网 络 对 输入 、 输 出 样本 函数 进行 了 初步 的 逼近 ， 虽然 有 一 些 误差 ， 但 基本 
上 达到 了 拟 合 的 效果 。 我 们 可 以 增加 一 些 新 的 输入 值 , 对 网 络 进行 仿真 ， 并 将 其 用 加 号 "+” 
绘制 到 原 图 上 。 输 入 如 下 命令 : 


P = 3.5; 

a = sim(net,p); 

plot(P,a，'+' markersize',10,'color'， [1 0 0]); 
title(' 新 输入 值 ') 

xlabel('P and P') 

yYlabel('T and a') 
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图 11-15 网络 输 出 与 样本 比较 
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图 11-16 ”新 输入 样本 的 输出 


图 11-6 中 ， 新 的 样本 点 用 加 号 “+” 表 示 。 下 面 增加 更 多 的 新 输入 样本 点 ， 将 网 络 仿 
真 响应 用 曲线 连接 起 来 。 输 入 如 下 命令 : 

P2 = 0:.1:9; 

RA2 = sim(net,P2); 

plot (P2,A2,'linewidth'4, color' [1 0 0]) 

title( ' 网 络 拟 合 的 函数 曲线 ' ) 

xlabel('P and P2') 

Ylabel('T and A2') 


绘 出 的 曲线 如 图 11-17 所 示 。 
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图 11-17 GRNN 网 络 拟 合 结果 


11.5.5 “概率 神经 网 络 模式 分 类 
概率 神经 网 络 ( PNN ) 通常 被 用 来 对 输入 样本 进行 ， 本 节 对 其 举例 进行 说 明 。 


【 例 11-7】 概率 神经 网 络 模式 分 类 实例 。 对 给 定 的 输入 、 输 出 样本 点 集 ， 创 建 PNN 
进行 分 类 。 
解 ，@ 定义 输入 、 输 出 样本 向 量 ， 并 作 图 。 注 意 此 处 输入 样本 向 量 为 二 维 的 ， 输 出 向 量 
表征 输入 向 量 的 所 属 类 别 。 输 入 如 下 命令 : 


PerIl2; 22; 11'5 

Te = [123]; 

plot(P(1,:),P(2,:) .markersize' ,30) 

for i=1:3， text(P(1,i)+0.1,P(2,i),sprincft('class $g'Tc(i)))，endq 
axis([0 3 0 3]) 

title('3 个 样本 向 量 ' ) 

xlabel('P(1,:) 

ylabel('P(2,:) ') 


绘 出 图 形 如 图 11-18 所 示 ， 
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图 11-18 3 个 样本 向 量 
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人 @ 要 应 用 函数 newpnn 创建 概率 神经 网 络 ， 我 们 需要 将 标号 转换 为 向 量 ， 这 可 以 通 
过 ind2vec 函数 来 完成 ， 同 时 设 定 网 络 散布 常数 等 于 1， 输 入 命令 如 下 ; 

T = ind2vec(Tc)， 

spread = 11 

net = newpnn{(P,T,spread); 

下 面 对 利 用 输入 、 输 出 样本 对 网 络 的 输出 进行 仿真 测试 ， 此 处 需要 将 输出 结果 向 量 重 
新 转换 成 为 标号 。 输 入 如 下 命令 : 


A = sim(net,P) 7 
Ac = vec2ina(R) 7 





plot(P(1,:),P(2,:)，'o'v'markersize',10) 
axis([0 3 0 3]) 
for i=1:3,text(P(1,i)+0.1,P(2,i),sprintf('class 8g',Rhc(i))),ena 


title(' 网 络 仿真 测试 结果 ' ) 
xlabel('P(1,:) ') 
Ylabel('P(2,:) ') 


绘 出 图 形 如 图 11-19 所 示 。 
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图 11-19 网 络 仿真 测试 结果 


可 以 看 到 ， 仿 真 输出 与 期 望 输出 是 完全 一 致 的 。 
侠 下 面 创建 一 个 新 的 输入 向 量 ， 应 用 创建 的 网 络 对 其 进行 分 类 。 输 入 命令 . 
pP = [2; 1.5]; 


aa = sim(net,p); 
ac = Vec2ind(a) 


holda on 
plot(p(1),p(2)，,'.'，'markersize',30,'color' [10 0]) 
text (P(1)+0.1,P(2),sprintf('class 8%g'vac)) 

holda off 


title(' 新 输入 样本 的 分 类 仿真 结果 ' ) 
xlabel('P(1,:) and p(1)') 
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Ylabel('P(2,:) and p(2)') 


输出 图 形 如 图 11-20 所 示 。 
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图 11-20 ”新 输入 样本 的 分 类 仿真 结果 


可 以 看 到 ， 新 输入 的 向 量 被 划分 到 了 class2o。 
人 @@ 下 面 通过 立体 图 的 方式 ， 显 示 创建 的 概率 神经 网 络 三 个 类 别 的 分 界 区 域 。 输 入 命 
令 如 下 : 


p1 = 0:.05:3; 





p2 = pl 

[P1,P2] = meshgrid(p1,p2)， % 将 向 量 转 化 为 坐标 网 格 

pp = [P1(:) P2(:)] 7 

aa = sim(net,pp); S 仿 真 

aa = full(aa)7 % 将 输出 稀 玻 矩 阵 结构 转化 为 满 存储 结构 

m = mesh(P1,P2,reshape(taa(1,:),1length(pl),length(p2))); $% 绘 制 第 一 类 
set (m, 'facecolor',[0 0.5 1],'linestyle'，'none')7 

hold on 保持 图 形 

m = mesh(P1,P2,reshape(aa(2,:),1length(p1),length(p2)))7 % 绘 制 第 二 类 
set (m, ,facecolor',[0 1.0 0.5],'linestyle'，'none') 

m -= mesh(P1,P2,reshapeltaa(3,:),length(pl),length(p2))); 。 % 绘 制 第 三 类 
set (m,'facecolor',[0.5 0 1],'linestyle'，'none')) 
plot3(P(1,:),P(2,:) [1 1 1]+0.1， -markersize' 30) 
plot3(tp(1),p(2) ,1.1，' -wmarkersize',30,color' LO 0) 

hold off s# 解 除 保持 

view(2) s# 设 置 由 顶 向 下 二 维 视角 显示 


title('3 类 划分 区 域 ') 
xlabel('P(1,:) and p(1) ') 
ylabel('P(2,:) and P(2)') 


绘 出 的 图 形 如 图 11-21 所 示 。 
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图 11-21 概率 神经 网 络 的 模式 分 类 情况 
图 11-21 清楚 地 显示 了 应 用 此 概率 神经 网 络 进行 模式 划分 的 决策 线 。 


本 章 首先 介绍 径 向 基 网 络 神经 元 和 网 络 结构 ， 然 后 介绍 两 种 变形 的 径 向 基 网 络 ， 即 广 
义 回归 神经 网 络 和 概率 神经 网 络 ， 最 后 通过 实例 介绍 径 向 基 网 络 的 应 用 。 
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自 组 织 神经 网 络 是 神经 网 络 领域 内 最 激动 人 心 的 方向 之 一 ， 它 是 受 生物 神经 系统 结构 
和 现象 启发 而 建立 的 人 工 神经 网 络 结构 。 

1981 年 ， 芬 兰 学 者 Kohonen 提出 了 一 个 较为 完整 的 、 分 类 性 能 较 好 的 自 组 织 特征 映 
射 神经 网 络 ( SQM 网 络 )。SQM 网 络 一 般 具 有 输入 层 和 竞争 层 两 层 结 构 ， 其 中 竞争 层 为 其 
核心 层 。 网 络 模拟 了 大 脑 神经 细胞 对 外 界 刺激 的 反应 ， 通过 输入 样本 反复 的 无 监督 学 习 ， 
将 输入 模式 的 统计 特征 融 解 到 各 个 连接 权 值 上 ， 实现 特定 区 域 的 神经 元 对 特定 模式 的 输入 
产生 响应 的 功能 ， 同 时 具有 很 强 的 抗 干扰 能 力 。 

自 组 织 神 经 网 络 还 有 其 他 的 种 类 ， 例 如 学 习 向 量 量化 网 络 ( LVQ 网 络 ) 等 。LVQ 网 络 是 
一 种 利用 有 监督 学 习 对 竞争 性 网 络 进行 训练 的 网 络 类 型 。 在 无 监督 学 习 的 训练 方式 下 ， 竞争 
层 对 输入 样本 进行 模式 分 类 只 依赖 输入 向 量 之 间 的 距离 。 如 果 两 个 输入 向 量 的 距离 接近 的 话 ， 
就 会 被 划分 为 同一 类 ， 而 利用 LVQ 网 络 ， 则 可 以 由 用 户 定义 标准 ， 对 输入 向 量 进行 分 类 。 

自 组 织 神经 网 络 包括 自 组 织 竞争 网 络 、 自 组 织 特征 映射 网 络 、 学 习 矢量 量化 等 网 络 结 
构 形式 ， 下 面 我 们 将 对 这 几 种 形式 的 网 络 结构 和 学 习 算法 进行 介绍 。 


EEE 量 自 组 织 竞争 网 络 


12.1.1 ， 自 组 织 竞 争 网 络 结构 模型 


图 12-1 给 出 了 一 个 具有 R 个 输入 的 自 组 织 神经 网 络 结构 图 。 自 组 织 竞争 网 络 通常 包含 
两 层 神经 元 ， 第 一 层 为 输入 层 ， 第 二 层 为 竞争 层 ， 2 竞争 层 中 lldist1 
的 输入 为 输入 向 量 p 与 输入 层 权 值 矩 阵 TW'… ， 输 出 结果 为 一 个 含有 381 人 个 元 素 的 向 量 ， 其 
中 各 元 素 为 输入 向 量 与 权 值 矩阵 的 各 个 行 向 量 7 生机 





图 12-1 自 组 织 网 络 结构 示意 图 
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通过 计算 输入 向 量 与 权 值 向 量 ,TY 的 距离 的 相反 数 ， 然 后 与 偏差 六 求 和 得 到 结果 
二， 以 此 作为 竞争 层 网 络 的 输入 。 如 果 所 有 的 偏差 均 为 0， 则 竞争 层 神经 元 的 最 大 网 络 输 
入 为 0， 此 时 ， 网 络 输入 与 权 值 向 量 恰好 相等 。 

竞争 传递 函数 接收 上 一 层 中 各 神经 元 的 输出 ， 当 神 经 元 竞争 胜出 时 ， 输 出 为 1， 其 他 
所 有 竞争 失败 的 神经 元 的 输出 均 为 0。 如 果 所 有 的 偏差 均 为 0,， 则 权 值 向 量 与 输入 向 量 的 
距离 最 小 的 神经 元 具有 最 小 的 负 值 网 络 输入 ， 从 而 能 够 赢得 竞争 ， 输 出 为 1。 


12.1.2， 自 组 织 竞争 神经 网 络 的 学 习 算法 


自 组 织 况 争 神经 网 络 通常 采用 由 内 星 学 习 规 则 发 展 来 的 Kohonen 学 习 规则 , 下 面 对 其 
进行 介绍 。 

格 劳 斯 贝 格 ( S.Grossberg ) 为 解释 人 类 和 动物 的 学 习 现象 ， 提出 了 两 种 类 型 的 神经 元 
模型 内 星 ( Instar ) 和 外 星 ( Outstar )。 内 星 神经 元 通常 被 训练 来 识别 一 个 向 量 ， 而 外 星 
神经 元 通常 被 训练 来 生成 一 个 向 量 。 


1. 内 星 学 习 规则 
内 星 神经 元 模型 结构 如 图 12-2 所 示 。 





图 12-2 ”内 星 神经 元 模型 结构 


图 12-2 中 的 神经 元 具有 r 个 输入 ， 其 各 个 输入 值 六 组 成 输入 向 量 忆 ， 通 过 权 值 向 量 
多 连接 ， 形 成 网 络 输入 。 其 网 络 结构 呈 星 形 ， 信号 沿 箭头 方向 流向 网 络 的 内 部 。 

实现 内 星 输入 与 输出 转换 的 传递 函数 为 harlim 硬 限 值 函数 。 通 过 内 星 及 其 学 习 规则 可 
以 训练 ， 使 得 某 一 神经 元 节点 只 对 特定 的 输入 向 量 产生 响应 ， 这 是 借助 于 调节 网 络 权 值 向 
量 w 近似 于 输入 向 量 尸 来 实现 的 。 

图 12-2 中 所 示 的 单 内 星 结构 对 权 值 进行 修正 的 学 习 规 则 为 ; 

Anwy = 灵 ( 记 一 mh)a 

其 中 ，7 =12…,r ， 设 此 单 内 星 的 权 值 向 量 为 Wi ， mi 为 Wi 的 第 /个 元 素 ， 疡 为 输 
入 向 量 的 第 / 元素 ， 和 为 网 络 学 习 速率 。 

此 规则 称 为 格 劳 斯 贝 格 内 星 学 习 规则 。 可 以 看 到 ， 在 此 学 习 规则 下 ， 内 星 神经 元 连接 权 值 
的 变化 Awu 是 与 输出 成 正比 的 。 内 星 的 传递 函数 即 硬 限 值 函数 输出 为 1 或 0， 分 别 对 应 高 值 和 
低 值 ， 如 果 输 出 “被 某 一 外 部 方式 保持 为 高 值 时 ， 通 过 反复 的 学 习 ， 就 可 以 使 变化 量 Aw 逐渐 
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减少 ， 内 星 权 值 逐渐 接近 输入 Pj ， 最 终 达 到 wj = 忆 ， 从 而 使 得 内 星 权 值 向 量 ; 能 够 对 输入 
向 量 忆 进行 识别 。 然 而 ， 如 果 内 星 输出 a 保持 为 低 值 ， 则 网 络 权 值 的 学 习 过 程 可 能 无 法 进行 。 
考虑 不 同 的 输入 向 量 己 和 PP 分 别 出 现 在 同一 个 内 星 时 的 情况 ， 此 内 星 权 值 向 量 记 为 
W 。 首先 ,为 了 训练 需要 ， 先 要 将 输入 向 量 进 行 归 一 化 处 理 ， 对 每 一 个 输入 向 量 除 以 所 有 
向 量 的 平方 和 ， 由 此 得 到 的 新 输入 向 量 的 模 值 为 1。 
当 第 一 个 输入 向 量 已 输入 给 内 星 后 ， 网 络 经 过 训练 ， 权 值 向 量 达到 了 W = (P)7 的 状 
态 。 而 后 输入 另 一 个 向 量 PP 。 此 时 内 星 的 加 权 输 入 之 和 可 由 下 式 表示 : 


N= 印 .P2=(PD7.P2 = 人 2 je?-eosez =cosg 





此 加 权 输 入 就 是 新 输入 向 量 与 原 输入 向 量 的 点 积 ， 由 于 归 一 化 后 向 量 模 值 为 1， 故 加 
权 输 入 就 是 两 个 输入 向 量 之 间 的 夹 角 余弦 。 

内 星 的 加 权 输 入 和 可 分 为 3 种 情况 。 

。 情况 1，P2 = PP ， 两 者 夹 角 62=0， 此 时 内 星 加 权 输 入 和 为 1 

。 情况 2， 忆 2 不 等 于 P! ， 随 着 已? 向 着 远离 严 的 方向 移动 ， 内 星 加 权 输 入 和 将 逐渐 

减少 ,直到 忆 : 与 已 垂直 ， 即 =90” ， 此 时 内 星 加 权 输 入 和 为 0。 

。 情况 3，P2=- 已， 即 62=180* 时 ， 内 星 加 权 输 入 和 达到 最 小 ， 取 值 为 -1。 

可 见 ， 对 于 一 个 经 过 训练 的 内 星 网 络 ， 当 输入 端 再 次 出 现 训练 样本 向 量 的 时 候 ， 内 星 
将 会 获得 值 为 1 的 加 权 输 入 ;而 如 果 输 入 为 与 训练 样本 不 相同 的 向 量 时 ， 产 生 的 加 权 输 入 
和 总 是 小 于 1 的 。 如 果 将 内 星 加 权 输 入 和 送 给 一 个 偏差 略 大 于 -1 的 硬 限制 二 值 传递 函数 
时 ， 对 于 接近 已 学 习 的 向 量 的 输入 ， 内 星 的 输出 为 1， 其 他 的 情况 则 输出 为 0 

实际 上 ， 权 值 向 量 W 与 输入 向 量 尸 的 点 积 ， 就 反映 了 输入 向 量 与 权 值 向 量 的 相似 度 。 
当 多 个 相似 的 输入 向 量 输入 内 星 时 ， 最 终 的 训练 结果 是 使 得 网 络 的 权 值 向 量 趋向 于 相似 输 
入 向 量 的 平均 值 。 

内 星 网 络 中 的 相似 度 是 由 偏差 吕 来 控制 的 。 典 型 的 相似 度 值 为 -0.95， 这 意味 着 输入 向 
量 与 权 值 向 量 之 间 的 夹 角 小 于 18"48'。 若 b=-0.9， 则 夹 角 扩 大 为 25"48'。 

MATLAB 神经 网 络 工具 箱 中 内 星 学 习 规 则 对 应 的 函数 为 leamiso 


2. 外 星 学 习 规 则 
外 星 神经 元 模型 结构 如 图 12-3 所 示 。 





图 12-3 ”外 星 神经 元 模型 
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外 星 网 络 采用 线性 函数 作为 传递 函数 ， 它 被 用 来 学 习 和 回忆 一 个 向 量 ， 其 网 络 输入 忆 
也 可 以 是 另 一 个 神经 元 的 输出 。 图 中 的 外 星 网 络 具有 * 个 输出 ， 其 所 用 的 学 习 规则 与 内 星 
规则 也 非常 相似 。 其 公式 为 





Awn = 太 r:(@i 一 mi) 


其 中 1=12…,s，J =12…,r ，7 为 输入 向 量 的 维 数 ; 设 单 外 星 的 权 值 向 量 为 本 | ，wn 
为 Wi 的 第 / 个 元 素 ，/r 为 网 络 学 习 速 率 。 此 外 ， 这 里 输入 慷 是 硬 限 值 函数 的 结果 , 只 取 0、 
1 两 个 值 。 

与 内 星 不 同 的 是 ， 外 星 连 接 权 值 向 量 的 变化 AWi 是 与 输入 向 量 忆 成 正比 的 ， 这 意味 
着 ， 当 输入 向 量 保持 为 高 值 时 ， 外 星 的 权 值 将 趋 于 输出 值 。 

当 输 入 向 量 =0 保持 为 低 值 时， 网 络 权 值 不 进行 学 习 与 修正 。 

内 星 与 外 星之 间 的 对 称 性 是 非常 有 用 的 。 对 一 组 输入 和 目标 向 量 来 训练 一 个 内 星 层 ， 
若 将 其 输入 与 目标 向 量 对 换 , 训练 产生 一 个 外 星 层 , 这 两 者 的 权 值 和 矩阵 恰好 是 对 方 的 转 置 。 

MATLAB 神经 网 络 工具 箱 中 外 星 学 习 规则 对 应 的 函数 为 learnos。 


3，Kohonen 学 习 规则 
Kohonen 学 习 规 则 是 从 内 星 规则 发 展 而 来 的 。 在 竞争 型 神经 网 络 中 ， 只 对 竞争 中 胜出 
的 那 一 个 神经 元 的 权 值 进行 调整 。 假 定 ， 第 i 个 神经 元 在 竞争 中 胜出 ， 则 其 输入 权 值 矩阵 
第 ;i 行 就 按照 下 面 的 公式 进行 调整 
MY "DJ)=iWY (9-D+a(p(g)-iY"(9-D) 


其 中 ，9 为 迭代 次 数 ，a 为 调整 系数 ，Kohonen 学 习 规 则 使 得 神经 元 权 值 矩阵 可 以 学 
习 一 个 输入 向 量 ， 因 此 在 模式 识别 中 很 有 用 处 。 在 此 学 习 规则 之 下 ， 距 离 输入 向 量 最近 的 
神经 元 的 权 值 向 量 将 会 更 加 接近 输入 向 量 。 如 果 网 络 获得 一 个 相似 的 输入 向 量 ， 此 神经 元 
会 更 有 更 大 的 几率 胜出 ， 而 如 果 网 络 获得 一 个 不 相似 的 输入 向 量 的 话 ， 此 神经 元 胜出 的 可 
能 性 将 降低 。 

随 着 网 络 获得 的 输入 向 量 越 来 越 多 ， 竞 争 层 中 每 个 距离 这 一 组 输入 向 量 最 近 的 神经 元 
的 权 值 将 会 向 着 这 些 输入 向 量 的 方向 调整 。 最 终 ， 如 果 网 络 中 有 足够 多 的 神经 元 的 话 ， 每 
一 类 相似 的 输入 向 量 将 会 令 一 个 神经 元 产生 ! 的 响应 , 而 其 他 神经 元 产生 0 的 响应 。 从 而 ， 
此 竞争 型 神经 网 络 能 够 通过 学 习 实 现 对 输入 向 量 的 分 类 。 

MATLAB 神经 网 络 工具 箱 中 对 应 Kohonen 学 习 规则 的 函数 为 learnko 


4 偏差 学 习 规 则 

竞争 型 神经 网 络 有 一 个 局 限 性 : 网 络 中 一 部 分 神经 元 的 权 值 向 量 的 初始 值 可 能 与 所 有 
的 输入 向 量 都 相差 过 大 ， 因 此 在 训练 过 程 中 永远 都 无 法 赢得 竞争 ， 因 而 不 论 训练 持续 时 间 
多 长 ， 它 们 的 权 值 向 量 都 没有 学 习 的 机 会 。 这 些 神经 元 被 称 为 “死神 经 元 "， 是 网 络 中 有 
缺陷 的 部 分 。 

为 了 防止 这 一 点 ， 可 以 对 偏差 进行 调整 ， 将 正 的 偏差 值 加 到 负 的 距离 上 去 ， 从 而 使 得 
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那些 在 竞争 中 很 少 胜出 的 神经 元 能 够 获得 更 多 的 胜出 机 会 。 

在 实际 操作 过 程 中 ， 首 先 保留 神经 元 输出 的 均值 ， 它 应 该 等 于 输出 为 1 的 神经 元 在 所 
有 神经 元 中 所 占 的 百分比 , 然后 利用 此 平均 值 更 新 偏差 值 。 MATLAB 神经 网 络 工具 箱 中 用 
来 实现 此 功能 的 函数 为 learncon。 这 个 修正 过 程 使 得 经 常 活动 的 神经 元 偏差 越 来 越 小 ， 而 
那些 不 经 常 活动 的 神经 元 的 偏差 值 则 会 变 大 。 

随 着 不 经 常 活动 的 神经 元 的 偏差 值 的 增 大 ， 它 们 能 够 响应 的 输入 空间 范围 也 逐渐 增 
大 。 一 旦 输入 空间 范围 增 大 了 ，, 那些 不 经 常 活动 的 神经 元 在 竞争 中 胜出 的 机 会 也 就 增加 了 ， 
从 而 逐渐 达到 和 其 他 神经 元 一 样 活跃 的 目标 。 

此 算法 有 两 个 好 处 。 

(1 ) 解决 了 “死神 经 元 ”的 问题 。 如 果 一 个 神经 元 的 权 值 向 量 与 所 有 的 输入 向 量 都 相 
距 很 远 的 话 ， 将 永远 无 法 在 竞争 中 胜出 。 然 而 在 偏差 学 习 规则 下 ， 其 偏差 值 会 逐渐 增 大 ， 
从 而 可 能 赢得 竞争 。 当 在 竞争 中 胜出 后 ， 它 的 权 值 向 量 将 会 向 某 一 组 输入 向 量 的 方向 移动 ， 
一 旦 它 进入 了 某 一 输入 向 量 组 织 后 ， 就 完全 赢得 了 竞争 ， 此 时 ， 其 偏差 值 将 下 降 为 0， 从 
而 解决 “死神 经 元 ”的 问题 。 

({ 2 ) 可 以 使 得 每 个 神经 元 对 具有 相同 百分比 的 输入 向 量 进行 大 致 的 分 类 。 如 果 输 入 空 
间 中 的 一 个 区 域 中 所 包含 的 输入 向 量 百分比 较 大 ， 则 其 区 域 密度 越 大 ， 就 会 吸引 更 多 的 神 
经 元 ， 从 而 对 其 进行 更 细致 的 分 类 。 

竞争 网 络 通常 用 于 具有 典型 聚 类 特征 的 大 量 目 标 数据 的 识别 ， 但 是 当 遇 到 大 量具 有 概 
率 分 布 的 输入 向 量 时 ， 竞 争 网 络 就 显得 力不从心 了 。 这 时 候 可 以 采用 Kohonen 自 组 织 特征 
映射 网 络 来 处 理 ， 这 是 下 一 节 将 要 介绍 的 内 容 。 





自 组 织 特征 映射 网 络 


自 组 织 特 征 映射 网 络 ( Self-Organizing Feature Maps ) 又 称 做 SOFM 网 络 ， 是 由 芬兰 赫 
尔 辛 基 神 经 网 络 专家 Kohonen 在 1981 年 提出 的 。 这 种 网 络 模拟 大 脑 神经 系统 自 组 织 特征 
映射 的 功能 。 它 是 一 种 竞争 型 神经 网 络 ， 采用 无 监督 学 习 算法 进行 网 络 训练 ， 此 网 络 广泛 
地 应 用 于 样本 分 类 、 排 序 和 样本 检测 等 方面 本 节 对 其 网 络 模型 与 结构 进行 介绍 。 


12.2.1， 自 组 织 特征 映射 网 络 模型 


脑 科学 的 研究 表明 ， 人 类 大 脑 皮层 中 的 细胞 群 存在 着 广泛 的 自 组 织 现象 。 处 于 不 同 区 
域 的 神经 元 具有 不 同 的 功能 ， 它 们 具有 不 同 特征 的 输入 信息 模式 ， 对 不 同感 官 输入 模式 的 
输入 信号 具有 敏感 性 ， 从 而 形成 大 脑 中 各 种 不 同 的 感知 路 径 。 并 且 这 种 神经 元 所 具有 的 特 
性 不 是 完全 来 自生 物 遗 传 ， 而 是 很 大 程度 上 依赖 于 后 天 的 学 习 和 训练 

在 大 脑 皮层 中 ， 神 经 元 的 输入 信号 一 部 分 来 自 感觉 组 织 或 其 他 区 域 的 外 部 输入 信号 ， 
另 一 部 分 则 来 自 同一 区 域 的 反馈 信号 。 神 经 元 之 间 采 用 最 邻近 的 神经 元 之 间 相 互 激励， 次 
远 的 神经 元 相互 抑制 而 更 远 处 的 又 具有 一 定 的 激励 的 方式 进行 信息 交互 ， 从 而 实现 网 络 
的 自 组 织 特性 。 
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自 组 织 映 射 模型 具有 这 样 的 特点 : 输入 节点 与 输出 神经 元 的 权 值 互联 ;在 输出 神经 元 
之 间 进 行 竞争 选择 ， 输 出 神经 元 之 间 存 在 侧 抑制 。 从 功能 上 说 ， 它 能 够 将 单个 神经 元 的 变 
化 规则 与 一 层 神经 元 的 群体 变化 规则 联系 在 一 起 。 

从 网 络 结构 上 来 说 ， 其 最 大 特点 是 神经 元 被 放置 在 一 维 、 二 维 或 者 更 高 维 的 网 格 节点 
上 ， 图 12-4 是 最 普遍 的 自 组 织 特征 映射 SOFM 二 维 网 格 模型 。 





图 12-4 ”二 维 SOFM 网 格 模型 


SOFM 网 络 由 输入 层 和 竞争 层 组 成 ， 属 于 单 层 网 络 结构 。 输 入 层 是 一 维 的 神经 元 ， 具 
有 N 个 节点 ， 竞 争 层 的 神经 元 处 于 二 维 平面 网 格 节点 上 ， 构 成 一 个 二 维 节 点 和 矩阵， 共有 M 
个 节点 。 输 入 层 与 竞争 层 的 神经 元 之 间 都 通过 连接 权 值 进行 连接 ， 竞 争 层 邻近 的 节点 之 间 
也 存在 着 局 部 的 互 连 。SOFM 网 络 中 具有 两 种 类 型 的 权 值 ， 一 种 是 神经 元 对 外 部 输入 的 连 
接 权 值 ， 另 一 种 是 神经 元 之 间 的 互 连 权 值 ， 它 的 大 小 控制 着 神经 元 之 间 相 互 作 用 的 强 弱 。 

在 SOFM 网 络 中 , 竞争 层 又 是 输出 层 ， 竞 争 层 的 神经 元 通常 选择 线性 函数 作为 其 传递 
函数 ， 因 此 SOFM 网 络 输出 也 就 是 各 输入 向 量 的 加 权 和 。 

SOFM 网 络 通过 引入 网 格 形成 了 自 组 织 映 射 的 输出 空间 ， 并 且 在 各 个 神经 元 之 间 建 立 
了 拓扑 连接 关系 。 神 经 元 之 间 的 联系 是 由 它们 在 网 格 上 的 相互 位 置 所 决定 的 ， 这 种 联系 模 
拟 了 人 脑 中 的 神经 元 之 间 的 侧 抑制 功 能 ， 成 为 网 络 实现 竞争 的 基础 。 

SOFM 网 络 采用 的 学 习 算 法 为 无 监督 聚 类 法 ， 它 能 将 任意 模式 的 输入 在 输出 层 映射 成 
为 一 维 或 二 维 离散 图 形 ， 并 保持 其 拓扑 结构 不 变 。 也 就 是 说 ， 在 无 监督 的 情况 下 ， 通 过 对 
输入 模式 的 自 组 织 学 习 ， 使 得 竞争 层 能 够 将 输入 的 分 类 以 二 维 图 形 的 形式 表示 出 来 。 

另 一 方面 ， 通 过 反复 的 学 习 ，SOFM 网 络 够 使 得 连接 权 值 空间 分 布 密度 与 输入 模式 的 
概率 分 布 趋 于 一 致 ， 因 而 可 以 通过 连接 权 值 的 空间 分 布 来 反映 输入 模式 的 统计 特征 。 

在 MATLAB 工具 箱 中 , SOFM 网 络 中 的 神经 元 根据 一 些 拓扑 函数 的 设置 而 进行 排列 。 
比如 函数 gridtop、hextop、randtop 分 别 可 以 将 神经 元 按 格 点 、 六 边 形 ， 以 及 随机 拓扑 进行 
排列 。 神 经 元 之 间 的 距离 通过 距离 函数 根据 它们 的 位 置 计算 得 出 。 在 MATLAB 中 ， 距 离 
函数 有 4 个 ， 分 别 是 : dist、boxdist、linkdist、mandist。 其 中 linkdist 是 应 用 的 最 普遍 的 一 


个 。 


SOFM 网 络 采用 与 自 组 织 竞争 网 络 同样 的 方法 来 获得 在 竞争 中 胜出 的 神经 元 ， 此 神经 
元 用 ?表示 。 但 是 ， 与 自 组 织 竞争 网 络 不 同 的 是 ，SOFM 网 络 采用 的 Kohonen 学 习 规 则 不 
是 仅仅 更 新 胜出 的 单个 神经 元 的 权 值 ， 而 是 对 其 一 定 邻 域 Ne* (四 内 的 所 有 神经 元 的 权 值 都 
进行 更 新 。 对 权 值 进 行 更 新 的 表达 式 如 下 : 

iy(9)=iw(9-D+C(P(9) 一 rw(g-D) 
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或 写 做 : 





ip(g)=( 一 cim(9 一 D+CP(9) 
其 中 ， 邻 域 Ne(d 中 包含 了 所 有 与 胜出 神经 元 演 的 距离 在 一 定 范围 之 内 的 神经 元 。 
Ni(d)={7d 乏 四 

因此 ， 当 网 络 获得 一 个 输入 向 量 疡 时 ， 竞争 中 胜出 的 神经 元 以 及 其 邻 域内 的 神经 元 的 
权 值 向 量 都 会 朝 着 输入 向 量 六 的 方向 移动 。 在 经 过 多 次 反复 训练 之 后 ， 邻 域内 的 神经 元 整 
体 上 也 会 变 得 比较 相似 。 

另 一 种 SOFM 网 络 的 训练 规则 ， 称 为 批 处 理 算法 。 在 这 种 训练 规则 下 ， 网 络 一 次 获得 
整个 输入 样本 集 ， 然后 根据 训练 规则 决定 对 应 各 个 输入 向 量 哪 一 个 神经 元 会 胜出 。 胜出 的 
神经 元 及 其 邻 域内 的 所 有 神经 元 权 值 向 量 都 朝 着 所 有 输入 向 量 的 平均 位 置 进行 移动 。 

为 了 对 这 个 邻 域 的 概念 进行 说 明 ， 让 我 们 来 看 看 图 12-5 的 拓扑 结构 。 左边 的 图 中 , 在 
第 13 号 神经 元 周围 划 出 了 一 个 二 维 的 圆 形 邻 域 , 其 半径 为 4= lo 右 图 则 在 第 13 号 神经 元 
周围 划 出 了 一 个 半径 d= 2 的 邻 域 。 

@g@e@O 
人 @ 人 GO @ 


国 @G-@ 人 @@ 
国 因 因 @ 因 思 


N (1) N (2) 
日 1 





图 12-5 ”二 维 网 格 邻 域 示意 图 
其 中 ， 两 个 邻 域 分 别 可 以 写 做 : 
Nia(D) = {8.12,13,14,.18} 
以 及 
Nia(2) = {3,7,8,9,1112,13,14,15,17,18,19, 23} 


实际 上 ，SOFM 网 络 中 的 神经 元 并 不 一 定 要 排列 成 二 维 结构 。 同样 可 以 采用 一 维 排列 
方式 ， 或 者 三 维 或 更 高 维 的 排列 形式 。 对 于 一 个 一 维 的 SOFM 网 络 ， 直径 为 1 的 邻 域 只 包 
含 两 个 最 邻近 的 神经 元 ( 如 果 神 经 元 位 于 端点 的 话 ， 邻 域 只 包含 1 个 神经 元 ) 

当然 , 也 可 以 通过 其 他 的 方式 来 定义 距离 , 例如 ， 利用 直角 或 者 六 角形 的 神经 元 排列 。 
通常 来 说 ， 网 络 的 性 能 对 于 邻 域 的 形状 并 不 非常 敏感 

下 面 对 SOFM 网 络 中 的 几 种 拓扑 结构 及 其 相关 函数 ( gridtop、hextoP、 randtop ) 进行 
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介绍 。 
1. gridtop 

格 点 拓扑 结构 函数 gridtop 给 出 的 神经 元 排列 在 四 方形 的 格 点 上 ， 如 图 12.5 所 示 ， 
gridtop 函数 的 返回 结果 为 表示 神经 元 拓扑 结构 的 矩阵 。 下 面 举例 说 明 。 

【 例 12-1】 gridtop 函数 应 用 实例 。 利 用 gridtop 函数 得 到 一 个 包含 6 个 神经 元 的 2x3 
的 格 点 阵列 。 
解 : 直接 调用 gritop 函数 生成 一 个 格 点 阵列 拓扑 结构 的 SOFM 网 络 。 输 入 命令 ， 

pos = gridtop(2,3) 

输出 结果 为 


pos =0 1 0 1 0 1 
0 0 丰 工 2 2 


这 里 ， 神 经 元 1 位 于 格 点 坐标 (0,0) 处 ， 神 经 元 2 位 于 格 点 坐标 (1.0) 处 ， 而 神经 元 3 位 
于 格 点 坐标 (0,1) 处 ， 其 他 神经 元 的 位 置 依 此 类 推 ， 如 图 12-6 所 示 。 

注意 ， 如 果 将 gridtop 函数 的 两 个 参数 调换 一 下 次 序 ， 得 到 的 格 点 结构 矩阵 会 有 些许 
的 不 同 。 输 入 命令 ， 

pos = gridqtop(3,2) 

输出 结果 为 


pos =0 工 2 0 1 2 
0 0 0 1 王 1 


类 似 的 , 要 得 到 一 个 包含 80 个 神经 元 的 8x10 的 格 点 阵列 , 并 绘图 显示 , 可 以 输入 命令 ; 


pos = gridtop(8,10)7 
plotsom(pos) 


得 到 的 输出 结果 如 图 12-7 所 示 。 





-和 台 
"后 - 

0 1 

gndtop(2.3) 
图 12-6 ”gridtop(2.3) 生 成 的 格 点 结构 示意 图 图 12-7 gridtop(8.10) 生 成 的 格 点 结构 示意 图 
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可 以 看 到 ， 所 有 神经 元 确实 是 排列 在 和 矩形 格 点 上 。 
2.， hextop 
MATLAB 工具 箱 的 hextop 函数 给 出 的 神经 元 排列 在 六 方形 的 格 点 上 , 下 面 举例 说 明 。 


【 例 12-2】 hextop 函数 应 用 实例 。 利 用 hextop 函数 得 到 一 个 六 边 形 的 包含 6 个 神经 
元 的 2x3 的 格 点 阵列 。 
解 : 输入 命 

pos = hextop(2,3) 
得 到 的 输出 结果 为 : 

pos = 0 1.0000 0.5000 1.5000 0 1.0000 

0 0 0.8660 0.8660 1.7321 1.7321 

如 果 我 们 用 newsom 函数 创建 一 个 SOFM 网 络 的 话 ，hextop 是 默认 的 网 络 拓扑 形式 。 

同样 ， 要 得 到 一 个 包含 80 个 神经 元 的 8x10 的 六 方形 格 点 阵列 并 绘图 显示 ， 可 以 输入 
命令 : 


pos = hextop(8,10); 
plotsom(pos) 


得 到 的 输出 结果 如 图 12-8 所 示 。 
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图 12-8 ”hextop(8,.10) 生 成 的 格 点 结构 示意 的 
可 以 看 到 ， 所 有 神经 元 确实 是 排列 在 六 方形 格 点 上 。 
3. randtop 
MATLAB 工具 箱 的 randtop 函数 给 出 的 神经 元 排列 格式 为 随机 格 点 ， 下 面 举例 说 明 。 


【 例 12-3】 randtop 函数 应 用 实例 。 利 用 randtop 函数 得 到 一 个 包含 6 个 神经 元 的 2x3 
的 随机 排列 的 格 点 阵列 。 
解 : 输入 命令 : 
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pos = randtop{(2,3) 


得 到 的 输出 结果 为 : 
pos = 0 0.7620 0.6268 1.4218 “0.0663 “0.7862 
0.0925 0 0.4984 ”0.6007 1.1222 ”1.4228 


类 似 的 ， 要 得 到 一 个 包含 80 个 神经 元 的 8x10 的 随机 格 点 阵列 并 绘图 显示 ， 可 以 输入 
命令 : 


pos = randtop(8,10); 
plotsom(pos) 


得 到 的 输出 结果 如 图 12-9 所 示 。 














周 12-9 hextop(8,10) 生 成 的 格 点 结构 示意 图 


可 以 看 到 ， 输 出 的 格 点 排列 形式 确实 是 随机 无 规律 的 。 
下 面 对 SOFM 网 络 的 距离 函数 进行 介绍 。 在 MATLAB 工具 箱 中 ， 有 4 种 计算 神经 元 距 
离 的 方式 ， 分 别 对 应 四 个 距离 函数 : dist、linkdist、mandist、boxdist。 下 面 分 别 对 其 进行 介绍 。 


1 欧 几 里 得 距离 


开 = 人 xx 
y={70y2…m} 


其 欧 几 里 得 距离 的 计算 公式 如 下 : 


Dir= | 羡 -y 
=1 


【 例 12-4】 dist 函数 应 用 实例 。 定 义 3 个 神经 元 格 点 ， 并 利用 dist 函数 得 到 3 个 神 
经 元 的 欧 几 里 得 距离 。 
解 : 输入 命令 : 


pos2 =I012; 012) 
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输出 结果 为 : 
pos2 -0 1 
1， 


我 们 可 以 通过 dist 函数 得 到 这 3 个 神经 元 两 两 之 间 的 距离 。 输 入 命令 : 


D2 = dist{(pos2) 


得 到 计算 结果 为 : 
pD2 = 0 1.4142 2.8284 
1.4142 0 1.4142 
2.8284 1.4142 0 


可 以 看 到 ， 神 经 元 到 自己 的 距离 都 是 0， 而 神经 元 1 到 神经 元 2 的 距离 为 1.414， 这 正 
是 欧 氏 空间 的 直线 距离 。 

图 12-10 显示 了 gridtop 格 点 结构 中 的 一 个 中 心神 经 元 周围 的 二 维 邻 域 的 情况 。 中 心神 
经 元 的 邻 域 半 径 逐 渐 增 大 ,直径 为 1 的 邻 域 包含 了 中 心神 经 元 本 身 以 及 直接 相 邻 的 神经 元 ， 
而 直径 为 2 的 邻 域 则 包含 了 直径 为 1 的 邻近 神经 元 以 及 与 它们 直接 相 邻 的 神经 元 。 


上 -一 一 一 一 >| 








图 12-10 直线 距离 下 二 维 格 点 的 邻 域 示意 图 
对 于 dist 函数 ， 一 个 含有 $ 个 神经 元 的 神经 元 层 ， 可 以 得 到 一 个 SxS 的 距离 矩阵 。 
2 box 距离 


box 距离 表示 两 个 位 置 向 量 之 间 的 距离 ,假定 两 个 位 置 向 量 分 别 为 妖 和 已， 则 它们 之 
间 的 box 距离 为 


boxdist = max(| 忆 一 声 D) 
box 距离 对 应 的 MATLAB 工具 箱 函数 为 boxdist。 下 面 举例 说 明 。 


【 例 12-5】 boxdist 函数 应 用 实例 。 定 义 6 个 神经 元 格 点 ， 并 利用 boxdist 函数 得 到 3 
个 神经 元 的 box 距离 。 
解 : 输入 命令 : 


pos = gridtop(2,3) 
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pos =0 吉 0 1 0 1 
0 0 本 1 旺 党 


应 用 boxdist 函数 计算 各 个 格 点 的 box 距离 。 输 入 如 下 命令 : 


Q = boxdist (pos) 


输出 结果 为 : 

在 喜 才 和 工 工 2 2 
1 0 和 2 
1 昌 0 日 1 
1 1 1 0 1 1 
2 2 江 1 0 1 
2 这 1 1 了 0 


可 以 看 到 ， 从 神经 元 1 到 神经 元 2、3、4 的 box 距离 均 为 1， 因 为 它们 都 与 神经 元 1 


直接 相 邻 。 而 神经 元 1 到 神经 元 5、6 的 距离 为 2。 神 经 元 3、 神 经 元 4 到 其 他 所 有 的 神经 
元 的 距离 都 为 1。 


3. link 距离 


两 个 神经 元 之 间 的 link 距离 表示 的 是 这 两 个 神经 元 之 间 的 路 径 的 步 数 和 环节 数 。 应 用 
linkdist 函数 可 以 求 得 两 向 量 之 间 的 link 距离 。 下 面 举 例 说 明 。 


【 例 12-6】 linkdist 函数 应 用 实例 。 用 gridtop 函数 定义 6 个 神经 元 格 点 ,并 利用 linkdist 
函数 得 到 3 个 神经 元 的 link 距离 。 


解 : 输入 命令 : 
pos = gridtop(2,3) 
输出 结果 为 
pos =0 0 汪 0 芋 
0 0 1 L 2 2 


应 用 linkdist 函数 计算 各 个 格 点 的 link 距离 。 输 入 命令 : 
dlink = linkdist (pos) 
输出 结果 为 : 


dlink = 


bw Pen 
PPonn 
PenPen 
Pennuwn 
口 PPNww 


0 
1 
1 
2 
2 
3 


4. manhattan 距离 
两 个 向 量 夺 ，7 之 间 的 manhattan 距离 的 计算 公式 如 下 : 
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D = sum(abs(x-y)) 

x,y 为 两 个 向 量 中 对 应 的 元 素 ， 应 用 MATLAB 提供 的 mandist 函数 可 以 求 得 两 向 量 之 
间 的 manhattan 距离 ， 需 要 注意 的 是 ,在 应 用 mandist 函数 的 时 候 ， 两 个 向 量 必须 一 个 为 行 
向 量 ， 另 一 个 为 列 向 量 。 下 面 举例 说 明 。 

【 例 12.7】 ”mandist 函数 应 用 实例 。 定 义 两 个 向 量 ， 并 利用 mandist 函数 得 到 其 
manhattan 距离 。 

解 : 输入 命令 : 


wisesr2; 34f 56] 
?1L = 【131] 


得 到 的 输出 为 : 


应 用 mandist 函数 计算 向 量 之 间 的 manhattan 距离 。 输 入 如 下 命令 : 
2Z1 = mandist (1,P1) 
输出 结果 为 ， 
2z1 =1 
5 
9 


可 以 验证 ，manhattan 距离 的 计算 是 严格 按照 上 面 的 公式 执行 的 。 
以 上 即 SOFM 网 络 中 常用 的 四 种 距离 的 介绍 ， 下 面 我 们 介绍 SOFM 网 络 结构 。 


12.2.2 ” 自 组 织 特征 映射 网 络 结构 


图 12-11 是 一 个 SOFM 网 络 的 结 





mw 
ai=compettoD 


图 12-11 ”SOFM 网 络 结构 示意 图 
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SOMF 网 络 结构 与 自 组 织 竞 争 网 络 结构 相似 , 只 是 前 者 没有 偏差 。 对 于 胜出 的 神经 元 六 
的 输出 单元 ci， 竞争 传递 函数 的 响应 为 1; 而 对 于 其 他 的 神经 元 ， 竞争 传递 函数 输出 均 为 0。 

如 同上 面 所 描述 的 一 样 ， 距 离 胜出 的 神经 元 近 的 神经 元 均 同时 进行 权 值 更 新 ， 而 网 络 
的 格 点 拓扑 结 构 以 及 距离 形式 都 是 可 以 选择 的 。 


12.2.3 ” 自 组 织 特征 映射 网 络 的 学 习 规 则 


SOMEF 网 络 的 训练 过 程 如 下 : 首先 , 网 络 确认 获得 每 一 个 输入 向 量 对 应 的 胜出 神经 元 ， 
然后 定义 以 获胜 神经 元 为 中 心 的 一 个 邻 域 ， 对 其 中 所 有 神经 元 的 权 值 矩阵 进行 调整 ， 随 着 
训练 的 进行 ， 此 邻 域 将 会 逐渐 缩小 ， 一 直到 只 包含 胜出 神经 元 本 身 为 止 。 

通过 这 种 方式 ， 可 以 使 得 网 络 拓扑 结构 上 位 置 相 近 的 输出 节点 的 连接 权 值 向 量具 有 一 
定 的 相似 性 同时 又 有 区 别 ， 从 而 保证 了 对 于 某 一 类 输入 模式 ， 获 胜 节点 能 够 产生 最 大 的 响 
应 ， 而 相 邻 节点 产生 的 响应 较 小 。SOFM 网 络 的 训练 过 程 与 常规 的 自 组 织 竞 争 网 络 的 不 同 
之 处 ， 就 是 在 于 此 。 

此 外 ， 训 练 过 程 中 ， 神 经 元 彼此 之 间 相 互 竞争 ， 具 有 最 大 输出 的 神经 元 成 为 胜出 者 。 
获胜 的 神经 元 节点 对 其 他 竞争 对 手 产生 抑制 的 作用 ， 同 时 对 其 邻 域内 的 神经 元 产生 激励 的 
作用 。 只 有 与 胜出 节点 相 邻 的 神经 元 的 权 值 才 会 被 修正 ， 并 且 ， 此 邻 域 的 范围 是 随 着 训练 
的 过 程 不 断 变化 的 。 

在 训练 开始 时 ， 邻 域 半 径 通常 较 大 ， 调 整 的 节点 数量 也 较 多 ， 而 随 着 训练 的 进行 ， 邻 
域 半 径 逐渐 缩小 ， 最 终 缩小 为 仅 包 括 竞争 获胜 的 神经 元 节点 本 身 。 因 为 只 有 获胜 节点 才 是 
输出 图 形 最 佳 匹配 ， 所 以 说 ，SOFM 网 络 模仿 了 输入 图 形 的 分 布 状况 ， 提 取 了 输入 图 形 的 
特征 ， 将 其 中 特征 相似 的 归 为 一 类 ， 对 应 于 某 一 个 节点 的 胜出 。 

如 上 所 述 , 随 着 训练 的 进行 , 决定 邻 域 大 小 的 距离 逐渐 变化 , 整个 训练 可 以 分 为 两 个 阶段 。 


1 排序 阶段 

此 阶段 的 时 序 步 数 是 事先 给 定 的 。 在 此 阶段 ， 邻 域 距离 { 邻 域 半 径 ) 首先 给 定 为 初始 
值 ， 然 后 逐渐 减 小 到 调整 距离 ( 大 小 为 1.0 )。 随 着 邻 域 距离 的 减 小 ， 网 络 神经 元 根据 它们 
在 拓扑 结构 上 的 顺序 在 输入 空间 上 进行 排序 。 


2. 调整 阶段 

随 着 邻 域 距离 下 降 到 调整 距离 ， 训 练 进入 调整 阶段 ， 这 个 阶段 一 直 持续 到 训练 过 程 结 
束 。 在 整个 调整 阶段 ， 邻 域 的 距离 不 再 下 降 ， 始 终 是 调整 距离 ( 1.0 )， 在 此 过 程 中 ， 网 络 
通过 小 的 邻 域 进 行 细 调 ， 同 时 也 保持 上 一 阶段 的 排序 结果 的 稳定 。 

由 此 可 以 看 出 , 特征 映射 的 训练 结果 是 对 输入 空间 进行 聚 类 , 同时 学 习 其 拓扑 结构 和 分 布 。 








为 了 克服 SOFM 网 络 作为 无 监督 网 络 存在 的 缺点 ,Kohonen 尝试 将 竞争 学 习 思 想 和 有 
监督 学 习 算 法 结合 起 来 ， 从 而 产生 了 同属 于 竞争 网 络 的 学 习 矢量 量化 ( Leaming Vector 
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Quantization ) 网 络 ， 简 称 为 LVQ 网 络 。 这 种 网 络 结构 给 出 了 分 类 信息 作为 导师 信号 ， 人 允 
许 指定 将 输入 分 到 哪 一 类 。 





12.3.1 “学 习 矢 量 量化 网 络 结构 
图 12-12 是 一 个 LVQ 网 络 结构 的 示意 图 。 


输入 竞争 层 线性 层 





ml= -IIWAGL-P 中 -purelin(LW21aD) 
=compettn ) 


图 12-12 LVQ 网 络 结构 示意 图 


如 图 12-12 所 示 ，LVQ 网 络 为 两 层 网 络 结构 ， 第 一 层 为 竞争 层 ， 第 二 层 为 线性 层 。 其 
中 ， 竞争 层 对 输入 向 量 进 行 分 类 的 方式 类 似 于 SOFM 网 络 ， 线性 层 将 竞争 层 的 分 类 结果 按 
照 用 户 的 定义 重新 划分 为 目标 类 别 。 竞争 层 分 类 的 结果 被 称 为 子 类 ， 而 线性 层 的 分 类 结果 
成 为 目标 类 别 。 

不 论 竞争 层 还 是 线性 层 ， 都 是 一 个 神经 元 对 应 一 个 输出 类 别 既 包括 子 类 也 包括 目标 
类 别 )。 因 此 ， 竞 争 层 能 够 进行 划分 的 子 类 数 为 S1， 而 这 8! 个 子 类 经 过 线性 层 后 又 会 重新 
组 合 为 832 个 目标 类 别 。 其 中 ，3! 总 是 要 大 于 S。 

例如 ， 假 定 竞争 层 中 的 神经 元 1、2、 3 全 部 学 习 了 输入 空间 内 从 属于 线性 层 目标 类 别 
2 的 子 类 ， 那 么 竞争 层 神经 元 1、2、3 与 线性 层 神经 元 中 的 连接 权 值 矩 阵 工 W2" 的 元 素 为 
1， 而 与 线性 层 其 他 神经 元 的 连接 权 值 为 0。 如 果 竞争 层 中 神经 元 1]、2、3 中 的 任何 一 个 赢 
得 了 竞争 ， 线 性 层 的 输入 出 就 为 1 这 就 是 竞争 层 子 类 组 合 为 线性 层 目标 类 别 的 方式 。 

由 于 我 们 事先 知道 竞争 层 神经 元 与 输出 层 神经 元 的 子 类 组 合 方式 ， 因此 就 可 以 事先 给 
出 权 值 矩 阵 LW2”"。 但 是 ， 仍然 需要 通过 训练 过 程 以 使 得 第 一 层 神经 元 对 输入 向 量 训练 样 
本 集 能 够 产生 出 正确 的 子 类 输出 。 


12.3.2 “学 习 夭 量 量化 网 络 的 学 习 规 则 


学 习 矢 量 量化 网 络 采用 了 有 监督 的 学 习 规 则 ， 包 括 LVQ1 与 LVQ2 两 种 ， 下 面 对 其 进 
行 介绍 。 


1 LVQ1 学 习 规则 
假设 输入 、 输 出 样本 对 为 : 


{Pbtj,{pztzj (pwstw} 


260 入 访 





第 中 2 章 ， 自 组 织 神经 网 络 


期 望 输出 向 量 中 只 有 一 个 元 素 为 1, 其 余 均 为 0, 1 代表 与 输入 相关 的 目标 类 别 。 例 如 ， 
输入 和 期 望 输出 向 量 四 ,为 : 


0 

1 
有 

媚 =| ma=|0 

0 


1 
0 


输入 向 量 中 局 包含 4 个 元 素 ,期望 响应 ， 也 就 是 目标 类 别 ， 包 含 5 个 元 素 ， 每 个 输入 
向 量 将 被 划 归 到 5 个 类 别 之 一 。 初 始 的 分 类 结果 不 能 保证 正确 ， 但 网 络 经 过 训练 后 ， 输 入 
向 量 将 被 归 到 5 个 输出 类 别 中 的 第 2 类 。 

训练 过 程 中 , 输入 向 量 吕 与 网 络 权 值 矩 阵 忆 Wi 的 行 向 量 之 间 的 距离 采用 ndist 函数 计 
算得 到 。 假 设 网 络 第 一 层 即 竞争 层 的 第 i 个 神经 元 在 竞争 中 胜出 ， 则 竞争 层 传递 函数 的 输 
出 向 量 w 的 第 ;个 元 素 为 1， 其余 元 素 均 为 0。 

在 第 二 层 中 , 利用 第 一 层 的 输出 ml 与 第 二 层 权 值 CW24 相 乘 ， 结 果 相 当 于 al 中 为 1 的 
元 素 选中 了 相应 的 类 别 ， 这 个 类 别 就 对 应 着 输入 向 量 的 类 别 kr， 这 个 分 类 可 能 是 好 的 ， 也 
可 能 是 不 好 的 ， 因 此 ， 还 需要 对 权 值 矩 阵 忆 W 的 第 ; 行 调整 。 

如 果 分 类 正确 ， 权 值 矩 阵 需要 向 输入 向 量 咏 移动， 如 果 分 类 不 正确 ， 则 向 远离 输入 向 
量 六 的 方向 移动 。 

以 公式 表示 ， 在 分 类 正确 的 情况 下 ， 有 : 


从 而 可 以 计算 权 值 矩 阵 忆 W"… 的 第 i* 行 新 值 ， 
PIT" (DJ)=PIWY"(9-D+a(p()-TYHG-D) 
如 果 分 类 不 正确 ， 则 
村 =1z#me=0 
此 时 根据 下 面 的 公式 对 权 值 进行 更 新 : 
PZY" (DJ)= In -D-a(p(g)-PnYD( -1D) 


可 以 通过 误差 反 向 传播 的 方式 对 权 值 和 矩阵 TY 第 i# 行 进行 修正 ， 而 不 对 其 他 行 产生 
影响 。 以 上 的 修正 公式 使 得 竞争 层 神经 元 朝 着 目标 类 别 的 方向 移动 ， 最 终 落 入 正确 的 分 类 
空间 ， 同 时 远离 其 他 类 别 向 量 。 

MATLAB 中 LVQ 网 络 学 习 规 则 对 应 的 函数 为 leamlvl。 

2. LVQ2 学 习 规则 

LVQ2 学 习 规则 可 以 应 用 在 LVQ1 之 后 ， 从 而 提高 其 第 一 步 训练 的 效果 。LVQ2 学 习 

规则 与 LVQI1 学 习 规 则 类 似 ， 不 同 之 处 在 于 LVQ2 规则 中 第 一 层 中 只 有 与 输入 向 量 最 接近 
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的 两 个 向 量 得 到 更 新 ， 其 中 一 个 对 应 于 正确 的 分 类 ， 而 另 一 个 对 应 于 错误 的 类 别 ， 这 样 使 
得 输入 向 量 落 入 这 两 个 向 量 的 中 位 面 的 一 个 “窗口 ”中 。 
窗口 的 定义 如 下 : 





,机 而 
min( 和 ,一 )> 
( 网 3 





其 中 *=]- 巴 ， 而 由 ，d 分 别 为 输入 向 量 P 到 权 值 答 阵 向 量 "7W'"”” 和 7IW ”的 欧 氏 


1+w” 
距离 。 假 定 中 的 变动 范围 为 0.2 到 0.3。 例 如 ， 如 果 选 择 必 -0.25， 则 s=0.6。 这 表示 如 果 两 
者 的 距离 比值 超过 0.6， 这 两 个 向 量 就 要 进行 调整 
也 就 是 说 ， 如 果 输 入 向 量 六 与 PTW'… 属于 同一 类 ， 而 与 JW!" 则 不 属于 同一 类 ， 而 
输入 又 在 中 位 面 附近 ， 则 需要 对 两 个 向 量 进行 调整 
权 值 的 调整 公式 为 ， 


TIWH(D)=IWnG-D-ao(P(D)-rTW" (9-D) 
WOD)= InWT(-D+C(P(D) 一 PT (9-D) 


因此 ,如 果 两 个 权 值 向 量 与 输入 最 接近 , 一 个 属于 错误 的 类 别 而 另 一 个 属于 正确 的 类 别 ， 
而 输入 又 落 入 中 位 面 窗口 之 内 , 则 这 两 个 向 量 要 进行 调整 。 这 样 的 一 个 训练 过 程 可 以 使 得 经 
过 LVQl1 训练 初步 分 类 处 理 的 权 值 向 量 进行 更 细致 的 调整 ， 得 到 的 训练 结果 更 加 稳健 。 
MATLAB 中 LVQ2 学 习 规则 对 应 的 函数 为 learmlv2。 


12.3.3 ”与 自 组 织 映 射 网 络 的 比较 


LVQ 网 络 与 SOFM 网 络 都 是 芬兰 学 者 Kohonen 提出 的 网 络 模型 ， 同 属于 自 组 织 竞争 
型 网 络 ， 两 者 在 网 络 结构 上 非常 相似 。 

SOFM 网 络 的 最 大 优点 是 在 网 络 输出 层 引 入 了 拓扑 结构 ， 从 而 实现 了 对 生物 神经 网 络 
竞争 过 程 的 模拟 ; 而 LVQ 网 络 则 在 竞争 学 习 的 基础 上 引入 了 有 监督 学 习 算法 ， 被 认为 是 
SOFM 网 络 的 扩展 形式 。 

常用 的 结合 方法 是 ， 将 学 习 矢量 量化 算法 作为 自 组织 映 射 算法 的 补充 ， 在 输出 层 应 用 
具有 拓扑 结构 的 自 组 织 映 射 网 络 结构 ， 依 次 采用 自 组 织 映射 学 习 算 法 和 学 习 矢量 量化 算法 
对 网 络 进行 两 次 训练 。 

在 网 络 训练 过 程 中 ， 首先 采用 自 组 织 映射 算法 进行 训练 ， 网 络 以 无 监督 的 方式 对 输入 
进行 特征 提取 ， 目标 是 选择 一 个 小 的 合理 的 特征 集合 ， 使 它 包含 输入 数据 的 主要 特征 信息 。 
然后 在 此 基础 上 ， 采用 学 习 矢 量 量化 学 习 算法 对 网 络 进行 二 次 训练 。 在 原先 训练 的 基础 上 
指定 网 络 输出 神经 元 所 属 的 类 别 。 其 中 ， 二 次 训练 的 过 程 才 是 对 网 络 进行 实际 分 类 的 过 程 。 

实践 证 明 ， 在 加 入 学 习 矢量 量化 后 ， 网 络 的 分 类 边界 能 够 进一步 地 收缩 ， 从 而 实现 对 
输入 向 量 更 为 准确 的 划分 。 

总 之 ，LVQ 网 络 作为 一 种 结合 了 自 组 织 特 征 映射 与 有 监督 学 习 算法 的 混合 网 络 结构 ， 
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本 身 输出 层 并 不 具有 拓扑 结构 ， 对 于 网 络 的 竞争 学 习 并 不 是 对 生物 神经 系统 的 最 好 模拟 ， 
但 是 应 用 在 实际 系统 中 ， 却 可 以 提高 系统 的 整体 性 能 。 





自 组 织 神经 网 络 的 MATLAB 实现 


12.4.1， 自 组 织 竞争 网 络 的 设计 
利用 MATLAB 工具 箱 函 数 newc 可 以 创建 一 个 竞争 型 神经 网 络 ， 其 调用 格式 为 ， 





newc = newc(P, S, KLR, CLR) 
其 中 : 
。 忆 为 输入 范围 ; 
。 3 为 神经 元 个 数 ; 
。KLR 为 Kohonen 学 习 速 率 ， 默 认 值 为 0.01; 
。 CLR 为 Conscience 学 习 速率 ， 默 认 值 为 0.001。 
下 面 通过 一 个 简单 的 示例 来 说 明 它 是 如 何 工作 的 。 


【 例 12-8】 定义 二 维 输入 向 量 六 = [.1, .8, .1，.9; .2, .9, .1, .8]， 创建 一 个 竞争 型 网 络 对 
其 进行 模式 划分 。 
解 ， (人 定义 输入 向 量 。 输 入 如 下 命令 ， 


P =0.1000 0.8000 0.1000 0.9000 
0.2000 0.9000 0.1000 0.8000 


其 中 有 两 个 向 量 接近 于 原点 (0.0)， 两 个 接近 于 (1,1)。 

儒 创建 一 个 两 神经 元 的 网 络 , 输入 变动 范围 为 [0,1]]， 调用 函数 newe 创建 竞争 型 神经 
网 络 。 输 入 命令 

net = newc([0 1; 0 1],2)， 

生成 的 网 络 权 值 位 于 输入 范围 的 中 点 位 置 ， 可 以 利用 下 面 的 命令 查看 

wts = ner.IW{1,1} 

输出 结果 为 


wts =0.5000 0.5000 
0.5000 ”0.5000 


可 以 看 到 ， 如 我 们 所 期 待 的 一 样 ， 网 络 的 初始 权 值 确实 位 于 输入 范围 的 中 值 位 置 。 偏 
差 值 则 是 用 函数 initcon 计算 得 到 的 。 输 入 下 面 语句 查看 偏差: 


biases = net.bf1} 
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给 出 的 结果 为 ; 


biases = 5.4366 
5.-4366 

这 样 我 们 就 得 到 了 一 个 竞争 型 神经 网 络 ， 但 是 我 们 仍然 需要 对 其 进行 训练 ， 使 其 能 够 
正确 地 完成 分 类 的 工作 。 注 意 ， 训 练 过 程 中 ， 每 一 个 神经 元 需要 竞争 以 对 输入 向 量 己 进行 
响应 。 

如 果 偏 差 值 为 0， 就 是 最 接近 输入 向 量 的 那个 神经 元 传递 函数 获得 的 输入 最 大 ， 并 
且 产 生 的 输出 为 1， 其 他 所 有 的 神经 元 输出 为 0。 关于 自 组 织 竞争 网 络 的 训练 我 们 将 在 下 
面 进行 介绍 。 


12.4.2， 自 组 织 竞争 网 络 的 训练 


【 例 12-9】 。 自 组 织 竞争 网 络 的 训练 实例 。 对 【 例 12-8 】 的 网 络 进行 训练 ， 使 其 能 够 
对 输入 向 量 正确 地 分 类 。 
解 ，(》 接 上 例 运行 的 结果 ， 首 先 查看 一 下 利用 newe 函数 生成 的 竞争 网 络 的 默认 网 络 训 
练 函 数 。 输 入 命令 : 


met .上 rainFcn 
输出 结果 为 : 
ans =Erainr 


这 表明 网 络 的 初始 训练 函数 为 trainre 我 们 将 网 络 的 训练 欠 代 次 数 设置 为 500， 并 使 用 
train 函数 进行 训练 。 输 入 命令 : 


net .trainParam.epochs = 500; 
net = rain(net,p); 


对 每 一 次 闪 代 ， 所 有 的 训练 样本 向 量 都 按 随机 的 顺序 输入 给 网 络 。 而 权 值 与 偏差 都 在 
每 一 次 样本 向 量 输入 后 进行 修正 。 

全 利用 输入 向 量 对 训练 后 的 网 络 进行 仿真 ， 最 后 将 输出 向 量 转化 为 标量 形式 显示 。 
输入 如 下 命令 : 


a = sim(net,p) 
ac = vec2ind(a) 


得 到 结果 为 ， 

ac= 1 2 1 

可 以 看 到 , 网 络 经 过 训练 后 , 将 输入 向 量 划分 到 了 两 个 目标 类 别 中 ， 其 中 接近 原点 (0.0) 
的 输入 向 量 划分 为 类 别 1， 而 接近 (1,1) 的 输入 向 量 ， 划 分 到 类 别 2。 

对 经 过 训练 后 的 网 络 ， 我 们 可 以 再 次 查看 其 权 值 矩阵 和 偏差 向 量 ， 得 到 的 结果 为 : 


wts = 0.1000 0.1467 
0.8474 ”0.8525 
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biases -= 5.4961 
5.3783 

在 实际 运行 过 程 中 ， 由 于 输入 样本 向 量 的 顺序 具有 一 定 的 随机 性 ， 查看 权 值 偏差 所 得 
到 的 实际 数值 可 能 有 所 不 同 。 

注意 ， 第 一 个 权 值 向 量 ， 也 就 是 权 值 矩 阵 的 第 一 行 构成 的 向 量 接近 于 输入 向 量 中 的 原 
点 ; 而 第 二 个 权 值 向 量 ， 也 就 是 权 值 和 矩阵 的 第 二 行 构成 的 向 量 ， 则 接近 于 输入 向 量 中 的 
(11) 因此 ， 网 络 经 过 训练 之 后 就 能 够 对 输入 的 向 量 进行 正确 的 分 类 。 

在 训练 过 程 中 , 竞争 层 每 一 个 靠近 输入 向 量 类 别 的 神经 元 权 值 矩 阵 都 会 朝 着 输入 向 量 的 
方向 移动 。 最 终 ， 如 果 神 经 元 数目 足够 多 的 话 ， 每 一 组 相似 的 输入 向 量 将 会 对 应 一 个 神经 元 
产生 等 于 1 的 输出 ， 而 对 于 其 他 神经 元 产生 的 输出 均 为 0， 从 而 实现 对 输入 向 量 的 识别 。 

全 通过 图 形 显示 的 方式 ， 竞争 层 的 权 值 向 量 和 输入 向 量 之 间 的 关系 可 以 得 到 更 好 的 
表现 。 下 面 的 图 12-13 以 加 号 “+" 显示 了 一 个 包含 两 个 元 素 的 输入 向 量 。 


Input Vectors 
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5 0 05 时 
图 12-13 “二 维 输入 向 量 示意 图 


上 面 的 输入 向 量 呈 现 出 成 组 的 方式 ， 这 样 的 情形 利用 竞争 型 网 络 进行 模式 划分 是 非常 
合适 的 。 


12.4.3 ”SOFM 网 络 的 设计 


应 用 MATLAB 工具 箱 函数 newsom 可 以 快速 地 创建 一 个 自 组 织 特征 映射 类 型 的 神经 

网 络 。 其 调用 格式 如 下 : 
net = newsom(P, [d1.d42，…], tfcn, dfen, steps, in) 

其 中 : 

e 忆 是 RxOC 阶 和 矩阵 ， 包 含 C 个 输入 向 量 ; 

。di 是 第 i 层 的 大 小 ， 默 认 值 为 [5 8]; 

。 ttcn 是 网 络 的 拓扑 函数 ， 默 认 值 为 hextop; 

。 dfcn 是 网 络 的 距离 函数 ， 默 认 值 为 linkdist; 
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e steps 是 调整 阶段 邻 域 变 为 1 的 步骤 ， 默 认 值 为 100; 
e 让 是 初始 网 络 大 小 ， 默 认 值 为 3。 
以 下 面 的 实例 进行 说 明 。 


【 例 12-10】 SOFM 网 络 设计 实例 。 假 定 输入 向 量 为 2 维 ， 取 值 区 间 分 别 为 [0，2] 和 
[0，1]， 以 此 来 建立 一 个 SOFM 网 络 ， 此 网 络 包含 6 个 神经 元 ， 按 2x3 的 形式 排列 。 
解 ，@@ 利用 newsom 函数 生成 SOFM 网 络 。 输 入 如 下 命令 : 


net = newsom([0 2; 0 1],[2 3])7 


全 定义 输入 向 量 。 输 入 命令 : 





束 二 js 2 8 -75 3 2 1 LT-8 Ti 
0.2 0.1 0.3 0.1 0.3 0.2.1.8 1.8 1.9 1.9 1.7 1.8] 


合 通过 plotsom 函数 绘制 出 生成 的 网 络 的 拓扑 结构 图 。 输 入 命令 : 


plot (P(1,:),P(2,:)，,'o'w'markersize',8) 

holda on 

plotsom(net .iw{f1l,1),ner.layers{t1).discances) 
hold off 


得 到 的 图 形 如 图 12-14 所 示 。 
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图 12-14 ”网 络 拓扑 结构 
其 中 的 空心 圆 点 代表 网 络 的 输入 向 量 , 实心 圆 点 代表 网 络 的 初始 权 值 向 量 。 可 以 看 到 ， 
输入 向 量 分 布 在 图 像 的 中 间 偏 上 的 位 置 ， 而 生成 的 网 络 权 值 向 量 初始 分 布 在 左 、 中 、 右 三 
个 点 处 。 可 以 对 输出 权 值 向 量 进行 查看 ， 输 入 命令 : 
net .iwf1,1)} 
得 到 输出 为 : 


ans =3.5000 ”1.7500 
3.5000 ”1.7500 
1.0000 “0.5000 
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1.0000 0.5000 
-1.5000 -0.7500 
-1.5000 -0.7500 


可 以 看 到 ， 网 络 权 值 确实 集中 在 三 个 点 。 对 网 络 进行 仿真 时 ， 计 算 每 个 神经 元 权 值 向 
量 相对 于 输入 向 量 的 负 距离 ， 从 而 得 到 权 值 输入 ， 也 即 特征 映射 层 传递 函数 的 输入 ， 然 后 
再 通过 竞争 训练 从 而 确定 胜出 的 神经 元 ， 并 产生 1 的 响应 输出 。 


12.4.4 SOFM 网 络 的 训练 

在 默认 的 情况 下 ,应 用 newsom 生成 的 SOFM 网 络 的 学 习 模式 为 批 处 理 模式 trainbuwb， 
而 权 值 向 量 的 训练 函数 为 earmsomb。 下 面 进行 举例 说 明 。 

【 例 12-11】 SOFM 网 络 训练 实例 。 针 对 【 例 12-10 】 生 成 的 网 络 进行 训练 , 并 查看 结果 。 
解 ， (人 直接 利用 train 函数 对 网 络 进行 训练 ， 设 定 最 大 训练 适 代 次 数 为 1000。 输 入 命令 ， 


net .trainParam.epochs = 1000) 
net = crain(net,P); 


可 以 从 弹出 的 nntraintool 窗口 中 看 到 ， 训 练 过 程 一 直 持续 到 1000 次 迭代 后 结束 。 通 
过 plotsom 函数 绘制 出 训练 后 网 络 的 拓扑 结构 图 。 输 入 如 下 命令 : 


Plotsom(net.iwftl,1ij,net.layers{f1).distances) 


绘 出 图 形 如 图 12-15 所 示 。 
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图 12-15 训练 后 网 络 的 拓扑 结构 


可 以 看 到 ， 经 过 训练 后 ，SOFM 网 络 中 各 个 神经 元 的 权 值 都 发 生 了 移动 。 如 果 继 续 训 
练 ， 各 个 神经 元 的 权 值 都 会 朝 着 输入 向 量 的 方向 移动 ， 从 而 学 习 输 入 空间 的 拓扑 结构 ， 对 
输入 向 量 进 行 模式 划分 。 


12.4.5 LVQ 网 络 的 设计 
应 用 MATLAB 工具 箱 函数 newlvq 函数 可 以 创建 一 个 LVQ 网 络 ， 其 调用 格式 如 下 : 
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net = newlvq(pr, sl, pc, lr, ID) 
其 中 : 
。 pr 为 Rx2 和 矩阵， 代表 输入 向 量 元 素 的 最 小 和 最 大 值 ; 
e sl 为 隐 层 的 神经 元 数目 ; 
e pc 为 二 元 向 量 ， 表 示 典 型 的 类 别 权重 百分比 ; 
elr 为 学 习 速率 ， 默 认 值 为 0.01; 
ef 为 学 习 函数 ， 默 认 值 为 leamlv1lo 
下 面 举 例 说 明 newlvq 函数 的 用 法 。 


【 例 12-12】 LVQ 网 络 设计 实例 。 假 定 有 10 个 二 维 输入 向 量 ， 以 此 来 建立 一 个 LVQ 
网 络 ， 将 其 划分 为 4 个 子 类 ， 此 网 络 竞争 层 包 含 4 个 神经 元 ， 然后 通过 线性 输出 层 ， 将 其 
划 归 到 两 个 输出 目标 类 别 。 

解 ; @ 定义 输入 样本 和 对 应 的 目标 类 别 。 输 入 如 下 命令 : 


p-I-3-2-20000223:01-121-1-21-10， 
rcitll2222111， 
得 到 输出 结果 为 : 
p--3 -2 -2 0 0 0% 9% 2 2 3 
站 
本 1 1 


可 以 利用 plotvec 函数 对 不 同类 别 的 输入 向 量 用 不 同 的 颜色 进行 显示 。 输 入 命令 ， 
plotvec(P,Tc，e) ， 


得 到 的 绘图 结果 如 图 12-16 所 示 。 
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图 12-16 “样本 向 量 的 分 类 情况 


其 中 黑色 点 代表 被 划分 为 目标 类 别 1 的 点 ， 灰色 点 代表 被 划分 为 目标 类 别 2 的 点 。 生 
成 的 网 络 首先 要 将 输入 类 别 划分 为 4 个 子 类 ， 而 最 终 目 标 是 要 将 向 量 Pi, Pa, pa, ps, pg， 以 
及 Pio 划 分 到 目标 类 别 1， 而 向 量 Ps, ps,P6， 以 及 术 划 分 到 目标 类 别 2 中 。 

注意 ， 因 为 这 个 问题 不 是 线性 可 分 的 ， 因此 用 感知 器 神经 网 络 无 法 解决 ， 但 是 LVQ 
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网 络 可 以 很 容易 地 解决 这 个 问题 。 

仿 将 目标 类 别 Tc 转化 为 LVQ 网 络 所 需 的 目标 向 量 的 形式 。 输 入 如 下 命令 : 

T = ind2vec(Tc)7 
得 到 的 结果 是 一 个 稀 朴 矩阵 7， 可 以 用 如 下 命令 进行 调整 ， 使 之 转化 为 一 个 满 存储 矩阵 ， 
以 便于 查看 : 

targets = full(T) 

输出 结果 为 : 


targets = 1 1 1 0 0 0 0 工 1 1 
0 0 0 1 1 1 0 0 0 


这 个 结果 看 来 targets 矩阵 正确 地 给 出 了 各 个 输入 向 量 与 目标 类 别 的 关系 。 下 面 利用 
newlvq 来 创建 LVQ 网 络 。 

需要 创建 的 网 络 其 第 一 层 有 四 个 神经 元 ， 第 二 层 有 两 个 神经 元 。 第 一 层 的 权 值 被 初始 
化 为 输入 向 量 范围 的 中 值 ， 这 是 由 midpoint 函数 确定 的 ; 第 二 层 的 权 值 中 有 60% 对 应 着 
targets 第 一 行 中 的 元 素 1，40% 对 应 着 targets 中 第 二 行 元 素 1。 输 入 命令 : 


net = newlvq(P,4, .6 .4])7 
查看 竞争 层 初 始 权 值 。 输 入 命令 
net .IW{1,1) 

输出 结果 为 : 


ans =0 
0 
0 
0 


可 以 看 到 ， 初 始 网 络 权 值 全 都 为 0， 这 确实 是 输入 向 量 的 范围 -3 到 3 的 中 点 。 同 样 可 
以 查看 第 二 层 的 权 值 。 输 入 命令 : 


net .LNW{2,1)} 
输出 结果 为 : 


anSs =1 工 0 0 
0 0 工 二 


这 个 结果 同样 也 是 可 以 理解 的 ， 它 的 含义 是 : 如 果 竞 争 层 输出 为 1， 则 被 划 归 为 目 
标 类 别 1， 如 果 竞争 层 输出 为 0， 则 被 划 归 为 目标 类 别 2。 也 就 是 说 ， 竞 争 层 的 前 两 个 
神经 元 连接 着 线性 层 的 第 一 个 神经 元 ， 竞 争 层 的 后 两 个 神经 元 连接 着 线性 层 的 第 二 个 
神经 元 。 

合 利用 sim 函数 对 网 络 进行 仿真 。 输 入 命令 : 


Y = sim(net,P) 7 
Yc = vec2ind(Y) 
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4 

输出 结果 说 明 所 有 的 输入 向 量 都 被 刘 入 了 类 别 1， 这 不 是 我 们 期 望 的 结果 ， 因 为 我 们 
还 没有 对 网 络 进行 训练 。 训 练 过 程 将 对 第 一 层 的 权 值 进行 调整 , 从 而 得 到 期 望 的 分 类 结果 ， 
训练 函数 将 在 下 一 节 介绍 。 


12.4.6 “LVQ 网 络 的 训练 


【 例 12-13】 LVQ 网 络 训练 实例 。 对 【 例 12-12 】 生成 的 网 络 进行 训练 ， 并 查看 结果 。 
解 ， 人 对 网 络 进行 训练 的 目的 是 调整 第 一 层 的 权 值 ， 从 而 使 之 生成 正确 的 分 类 结果 。 首 
先 将 训练 迭代 次 数 设 置 为 110， 然后 调用 train 函数 。 输 入 如 下 命令 ， 


net .trainparam.epochs = 1507 
net = train(net,P,T) 1， 


然后 查看 第 一 层 的 权 值 ， 输 入 命令 ; 
met .IW{1,1)} 
输出 结果 为 ， 


ans =0.2861 0.0095 
-0.1097 0.0000 

0 -0.0100 

0 0 


由 于 训练 过 程 的 随机 性 ， 每 次 训练 的 权 值 结果 并 不 一 定 完全 相等 。 输入 下 面 的 命令 ， 








clay 

plotvec(P,Tc，'w')， 

hold on; 

plotvec (net.IW{1)' ,vec2ind(net .LWL2))，o ) 7 
hold off); 


绘 出 图 形 如 图 12-17 所 示 。 
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图 12-17 “训练 后 竞争 层 网 络 权 值 的 分 布 情况 
270 办 入 入 
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图 中 不 同 点 的 颜色 深浅 代表 不 同 的 类 别 ， 星 型 点 代表 输入 和 目标 类 别 样本 点 ， 空 心 圆 
圈 代 表 为 训练 后 的 网 络 权 值 及 其 对 应 目标 类 别 。 可 以 看 到 ， 竞 争 层 网 络 权 值 朝 着 输入 向 量 
的 方向 发 生 了 移动 。 

利用 sim 函数 仿真 ， 验 证 网 络 训练 结果 。 输 入 命 


Y = sim(net,P)， 
Yc = vec2inda(Y) 


输出 结果 为 : 

Yc = 1 1 2 间 2 2 1 1 

可 以 看 到 ， 经 过 训练 的 网 络 确实 能 够 正确 地 对 输入 向 量 进行 分 类 。 

全 作为 最 后 一 步 检查 ， 我 们 可 以 利用 一 个 与 样本 向 量 接近 的 输入 向 量 进 行 测试 。 输 
入 命令 : 


pchkl = [0; 0.5]， 
Y = sim(ner,pchkl) 7 
Ycl = vec2ind(Y) 


输出 结果 为 ， 
xcl=- 2 


结果 是 正确 的 ， 因 为 pchkl 向 量 与 输入 向 量 中 属于 类 别 2 的 部 分 更 接近 。 类 似 的 ， 我 
们 可 以 试验 另 一 个 输入 向 量 。 输 入 如 下 命令 ， 


pchk2 = [1; 0); 
Y = sim(nec,pchk2); 
Yc2 -= vec2ind(Y) 


输出 结果 为 
xc2 = 1 


结果 同样 是 正确 的 ， 因 为 pchk2 向 量 与 输入 向 量 中 属于 类 别 1 的 部 分 更 接近 。 


用 BR 自 组 织 神经 网 络 应 用 实例 


本 章 介 绍 的 各 种 类 型 的 自 组 织 神经 网 络 应 用 方向 主要 集中 在 模式 分 类 领域 ， 这 一 节 我 
们 利用 实例 对 其 进行 介绍 。 


12.5.1 ， 自 组 织 竞争 网 络 模式 分 类 


【 例 12-14】 自 组 织 竞争 神经 网 络 模式 分 类 应 用 实例 。 对 给 定 的 具有 一 定 分 类 特征 的 
随机 输入 向 量 p， 创 建 自 组 织 竞争 神经 网 络 对 其 进行 分 类 。 
解 : @ 定义 具有 一 定 随机 性 和 分 类 结构 的 输入 向 量 。 输 入 如 下 命令 : 

x= (ft01 01]: s# 定义 输入 类 别 范围 
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clusters = 8; # 类 别 数目 

points = 10; s% 每 一 类 中 的 样本 数 

sta_dev = 0.05; 8 每 一 类 的 标准 差 

P = nngenc(X,clusters,points,std_dev); 。 % 生 成 输入 样本 向 量 序列 


其 中 nngenc 是 MATLAB 神经 网 络 工具 箱 中 用 来 生成 一 系列 输入 样本 向 量 的 函数 ， 该 
函数 需要 的 4 个 参数 分 别 为 : 输入 向 量 类 别 范围 、 类 别 数目 、 每 一 类 中 的 样本 数 ， 以 及 每 
一 类 的 标准 差 。 下 面 对 输 入 空间 进行 绘图 显示 。 输 入 命令 : 

plot(P(1,:) ,P(2，:) +z7) 7 

title('Input Vectors ') 1; 

xlabel('p(1) ) 7 

ylabel('p(2) '); 


绘 出 的 输入 空间 向 量 分 布 如 图 12-18 所 示 。 
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图 12-18 ”输入 向 量 空间 分 布 


可 以 看 到 ， 随 机 输入 向 量 在 空间 成 团 地 分 布 ， 大 约 分 为 8 组。 

全 下 面 利用 newc 函数 创建 自 组 织 竞争 网 络 ， 给 定 参数 分 别 为 ， 输入 空间 的 最 小 和 
最 大 值 、 神 经 元 数目 以 及 学 习 速率 。 然 后 ,将 其 权 值 向 量 绘图 显示 ， 对 应 其 初始 分 类 结果 。 
输入 如 下 命令 

net = newc([0 1;0 1],8,.1)， 

w = net .INW{1]7 

plot (P(1,:) ,P(2,:)， +) 

hola ony 

circles = plot(w(:,1),w(:,2) ob') 7 

绘图 结果 如 图 12-19 所 示 。 

图 中 圆圈 表示 的 就 是 初始 的 网 络 权 值 向 量 位 置 。 可 以 看 到 ， 网 络 的 初始 权 值 位 于 [0.3， 
0.5] 处 ， 并 不 能 够 很 好 地 体现 输入 向 量 的 空间 分 布 情 况 。 接 下 来 对 设计 的 竞争 网 络 进行 训 
练 ， 设 定 最 大 和 迭代 次 数 为 7 次 ， 然 后 对 训练 后 的 网 络 权 值 进行 绘图 显示 。 输 入 命令 ， 

net .trainParamepochs = 7; 


net = train(nec,P) 7 
w = net.IWt1}7 
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Gelete(circles)7 
plot(w(:，,1)，w(:, 2) ob') 7 
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图 12-19 初始 网 络 权 值 分 布 


绘 出 图 形 如 图 12-20 所 示 。 
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图 12-20 训练 后 网 络 权 值 分 布 


此 时 即 可 以 应 用 此 竞争 网 络 进行 模式 分 类 ， 其 中 每 一 个 神经 元 对 应 一 个 不 同 的 输入 类 
别 。 设 定 一 个 输入 向 量 对 网 络 进行 仿真 。 输 入 命令 : 


DP = [0; 0.2]， 

a = sim(net,Pp) 
输出 结果 为 

as= (2,1) 3 


函数 执行 的 结果 给 出 了 对 此 输入 向 量 响应 的 神经 元 ， 也 就 是 输入 向 量 对 应 的 类 别 。 


12.5.2 ”一 维 自 组 织 特征 映射 网 络 


自 组 织 网 络 可 以 表示 输入 空间 中 输入 向 量 的 位 置 ， 通 过 相 邻 神经 元 对 相似 的 输入 产生 
响应 ， 使 得 网 络 层 可 以 学 习 并 表示 出 输入 向 量 空间 的 拓扑 结构 。 


【 例 12-15】 一 维 自 组 织 特征 映射 网 络 应 用 实例 。 设 计 一 个 一 维 的 SOFM 网 络 ， 对 
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一 维 输入 空间 的 拓扑 结构 进行 表示 。 
解 ，(@ 定义 100 个 输入 向 量 ， 均 位 于 输入 空间 的 单位 加 上， 对 其 进行 绘图 显示 。 输 入 如 
下 命令 : 


angles = 0:0.5*pi/99:0.5*pii 
P = [sin(angles); cos(tangles)]; 
plot(P(1,:)，P(2,:) sr) 


得 到 输入 向 量 的 空间 分 布 图 如 图 12-21 所 示 。 
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图 12-21 ”输入 向 量 空间 分 布 


利用 newsom 函数 创建 一 个 一 维 的 SOFM 网 络 ， 包 含 10 个 神经 元 。 其 中 第 一 个 参数 
代表 网 络 有 两 个 输入 向 量 ， 其 变化 范围 均 为 [0 1] 。 

net = newsom([0 1;0 1],[10]); 

全 定义 网 络 训练 的 最 大 和 迭代 次 数 为 10 次 , 利用 train 函数 对 其 进行 训练 。 输 入 命令 ， 


net .trainpParam.epochs = 10) 
net = train(nec,P) 7 


然后 将 训练 后 网 络 权 值 进 行 绘图 显示 。 输 入 命令 : 
Plotsom(net .iwf1l,1},net- layers{f1ll.distances) 
绘 出 图 形 如 图 12-22 所 示 。 
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图 12-22 训练 后 的 网 络 权 值 分 布 
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观察 图 12-21 与 图 12-22 的 相似 性 ， 可 以 看 到 ， 此 时 的 网 络 权 值 正 是 输入 空间 的 拓扑 
结构 的 映射 。 当 输入 样本 向 量 时 ， 网 络 中 神经 元 1 到 10 中 至 少 有 一 个 的 输出 为 1, 代表 这 
个 输入 向 量 所 属 的 空间 划分 类 别 。 我 们 可 以 用 其 中 一 个 向 量 进行 仿真 ， 输 入 命令 ， 


P = [1;0]; 
a = sim(nect,p) 





aa= (10,1) 垃 


这 表示 了 输入 向 量 P 有 响应 的 神经 元 ， 也 即 忆 所 属 的 类 别 。 


12.5.3 ”二 维 自 组 织 特征 映射 网 络 


对 于 具有 一 定 特征 分 布 的 二 维 输入 样本 向 量 ， 可 以 利用 二 维 SOFM 网 络 对 其 进行 分 
类 。 下 面 举例 进行 说 明 。 

【 例 12-16】 二 维 SOFM 网 络 应 用 实例 。 设 计 一 个 二 维 的 SOFM 网 络 , 对 1000 个 二 
维 样本 输入 向 量 进行 分 类 。 
解 : @ 定义 1000 个 矩形 输入 空间 内 的 二 维 随机 输入 向 量 ， 对 其 进行 绘图 显示 。 输入 如 下 
命令 ; 


B = rands(2,1000)7 
ploet(P(1,:),P(2,:)，+E') 


绘 出 的 图 形 如 图 12-23 所 示 。 
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图 12-23 ”输入 向 量 的 空间 分 布 


全 由 于 输入 空间 的 向 量 分 布 与 拓扑 结构 比较 复杂 ， 需 要 用 一 个 复杂 度 比较 高 的 网 络 
来 进行 划分 。 这 里 设计 一 个 6 层 的 神经 网 络 ， 每 层 含 5 个 神经 元 。 其 中 每 个 神经 元 代表 一 
类 划分 ， 也 即 矩形 输入 空间 的 不 同 区域 ， 相 邻 的 神经 元 对 应 着 相 邻 的 空间 区 域 。 

利用 newsom 函数 设计 网 络 。 输 入 命令 : 

net = newsom([0 1; 0 1],1I5 6])7 


然后 利用 函数 plotsom 对 生成 的 网 络 权 值 进行 绘图 显示 。 输 入 命令 : 
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plotsom(net.iwt1,1j,net-layers{f1} .Qistances) 


绘 出 图 形 如 图 12-24 所 示 。 
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图 12-.24 ”初始 生成 的 网 络 权 值 分 布 


图 中 贺 点 代表 网 络 的 权 值 向 量 。 可 以 看 到 ， 初 始 生成 的 网 络 权 值 的 各 层 初始 值 是 相同 
的 ， 并 且 都 位 于 同一 直线 上 ， 因 此 图 中 只 能 看 到 5 个 圆 点 。 

合 下 面 利 用 @@ 中 生成 的 1000 个 输入 向 量 ， 对 网 络 进行 训练， 并 重新 绘制 网 络 权 值 
图 。 输 入 命令 : 

net .trainParam.epochs = 17 


net = train(net,P): 
plotsom(net.iw{t1,1)} ,nec .layers{1).distances) 


绘 出 图 形 如 图 12-25 所 示 。 
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图 12-25 训练 后 的 网 络 权 值 分 布 
可 以 看 到 ， 经 过 一 步 迭 代 的 训练 ， 网 络 权 值 移动 了 ， 每 一 个 权 值 代表 着 输入 空间 的 不 
同 区 域 ， 以 此 对 输入 空间 进行 分 类 。 
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全 下 面 利用 sim 函数 对 输入 向 量 进行 仿真 。 输 入 命 


p = [0.5;0.3]; 

a = sim(net,p) 
输出 结果 为 : 

a = (14,1) 


可 以 看 到 ， 对 此 输出 响应 为 1 的 神经 元 为 (14,1)， 也 就 是 此 输入 向 量 对 应 的 类 别 。 


12.5.4 LVQ 网 络 应 用 实例 


【 例 12-17】 LVQ 网 络 应 用 实例 。 设 计 一 个 LVQ 网 络 ， 根 据 期 望 目标 向 量 对 输入 向 
量 进行 分 类 。 
解 : @ 定义 一 个 10 个 二 维 输入 样本 向 量 P， 以 及 期 望 目标 类 别 C， 并 将 C 转化 为 向 量 形 
式 7。 输 入 命令 : 
P=-[-3-2-20000+2+2+3; 
or-liy2+r-l-2rl-l 0; 


[222 31741315 
ind2vec(c) 


C 
了 


对 输入 数据 点 绘图 显示 。 输 入 命令 : 


cla 4 清除 图 形 

for i=1:10 

if(C(i)==1) % 对 第 一 类 输入 以 加 号 “+” 显 示 
plot(P(1,i),P(2,i) t+) 

hola ony 

else 

plot(P(1,i),P(2,i)，o') % 对 第 二 类 输入 以 空心 圆 图 “co” 显 示 
hold on 

enda 

end 


给 出 图 形 如 图 12-26 所 示 。 
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图 12-26 ”输入 向 量 与 目标 响应 
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其 中 ， 第 一 类 输入 向 量 用 加 号 “+” 表 示 ， 第 二 类 输入 向 量 用 空心 圆圈 “o” 表示 。 

盒 利用 函数 newlvq 设计 一 个 LVQ 网 络 ， 对 上 述 数据 点 进行 分 类 。 这 里 需要 输入 4 
个 参数 ， 输 入 向 量 的 最 小 和 最 大 值 、 隐 层 神经 元 数目 、 表 示 册 型 类 别 的 百分比 的 向 量 ， 以 
及 学 习 速率 。 输 入 命令 : 

net = newlvq(minmax(P),4,[.6 .41,0.1)7 

对 LVQ 网 络 进行 绘图 显示 。 输 入 命令 : 


hola on 

W1 = net.INW{1)7 

plot(W1(1,1) ,WwW1(1,2) sw) 
title('Input/Weight Vectors') 17 
xlabel('P(1)， 网 (1) ) 了 
yYlabel('P(2)，W(3) ) 7 


绘 出 图 形 如 图 12-27 所 示 。 
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图 12-27 “初始 网 络 权 值 
图 中 ， 初 始 网 络 权 值 向 量 以 星 号 “* ”表示 ， 初始 生成 的 网 络 权 值 都 在 (0.0) 位 置 。 
人 @) 对 网 络 进行 训练 ， 设 定 最 大 和 迭代 次 数 为 150， 并 重新 绘图 显示 。 输 入 命令 ， 


net .trainParam.epochs=1507 
in(net,P,T): 





1 = net.IW{1) 7 
W2 = vec2ind(net.IW{iI)) 7 


clai s% 清 除 图 形 
for i=1:10 
if(C(i)==1) 
plot(P(1,i),P(2,i) t+) s 对 第 一 类 输入 向 量 以 加 号 “+” 显 示 
hold on; 
else 


ploc(P(1,i),P(2,i)，o') s# 对 第 二 类 输入 向 量 以 空心 圆圈 “o” 显 示 
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hold on; 
end 
end 
for i=1:4 
if{(W2(i)==1) % 对 第 一 类 神经 元 以 星 号 “* ”显示 
plot(w1(i，1),W1(i，2) we) 
hola on; 
else 和 和 否则， 以 实 ' ”显示 
plot(wl1(i，1) ,1(i，2) -0) 
hold on; 
end 
ena 
绘 出 图 形 如 图 12-28 所 示 。 
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图 7-28 训练 后 的 网 络 权 值 与 输入 向 量 


图 中 ，LVQ 网 络 神经 元 中 的 第 一 类 以 星 号 “*"” 表示， 第 二 类 以 实心 圆 点 “.” 表 示 。 
(全 下 面 对 此 网 络 进行 仿真 ， 输 入 向 量 为 [0.2; 1]。 输 入 命令 


p = [0.2; 1]; 
a = vec2ind(sim(net,p)) 
输出 结果 为 

aa = 2 


此 结果 说 明 训练 后 的 LVQ 网 络 将 此 输入 向 量 归 入 了 第 二 类 中 。 


到 人 小结 


本 章 分 别 对 自 组 织 竞争 神经 网 络 、SQM 网 络 、LVQ 网 络 的 结构 及 其 训练 算法 进行 了 
介绍 ， 并 通过 实例 介绍 了 其 应 用 。 


首 是 本 可 279 


第 13 章 ， 反 馈 神经 网 络 


1982 年 ， 美国 物理 学 家 Hopfield 发 表 了 一 篇 对 人 工 神经 网 络 很 有 影响 的 论文 。 在 论文 
中 , 他 提出 了 一 种 具有 循环 互联 的 反馈 型 人 工 神经 网 络 模型 ， 引 入 了 “能 量 函 数 " 的 概念 ， 
并 给 出 了 网 络 的 稳定 性 判 据 。 以 此 为 基础 发 展 出 的 神经 网 络 模型 被 称 为 反馈 型 神经 网 络 
(Recurrent Network )， 又 称 为 递归 神经 网 络 或 回归 网 络 。 

反馈 神经 网 络 的 目标 是 设计 一 个 能 够 存储 一 组 平衡 点 的 网 络 ， 使 得 当 给 定 一 组 网 络 初 
始 值 时 ， 网 络 能 够 通过 自 运行 最 终 收敛 达到 这 些 设计 的 平衡 点 。 

Hopfield 将 反馈 神经 网 络 应 用 于 约束 优化 问题 ,如 TSP 问题 的 求解 、 实 现 A/D 转换 等 ， 
又 利用 网 络 的 吸引 子 及 其 吸引 域 实现 了 信息 的 联想 记忆 功能 。 此 外 ， 由 于 Hopfield 网 络 与 
电子 模拟 线路 之 间 存 在 着 很 好 的 对 应 关系 ， 非 常 易于 理解 和 实现 ， 因 此 也 促进 了 人 工 智能 
和 神经 网 络 计算 机 的 发 展 。 

反馈 神经 网 络 的 系统 平衡 状态 可 以 通过 设计 网 络 的 权 值 而 存储 到 网 络 中 ， 并 且 一 个 网 
络 可 以 有 多 个 稳定 状态 ， 当 系统 从 某 一 初始 状态 开始 运动 时 ， 总 是 可 以 收敛 到 一 个 稳定 的 
平衡 状态 。 因 此 反馈 神经 网 络 属于 动态 类 型 的 网 络 。 

如 果 将 网 络 平衡 状态 看 做 网 络 的 记忆 ， 那么 网 络 由 任意 的 初始 状态 向 稳 态 变化 的 过 程 
就 可 以 看 做 网 络 的 一 种 寻找 记忆 的 过 程 。 反 馈 神经 网 络 具有 联想 记忆 的 能 力 ， 而 网 络 的 稳 
定 平衡 点 正 是 网 络 联想 记忆 的 基础 。 

反馈 神经 网 络 与 前 面 所 介绍 的 前 馈 型 神经 网 络 的 不 同 点 在 于 ， 反 馈 神 经 网 络 更 加 关心 
网 络 的 平衡 点 和 稳定 性 ， 即 如 何 得 到 和 利用 稳定 的 网 络 ， 而 前 饥 神经 网 络 更 加 关注 学 习 和 
训练 过 程 ， 以 及 非 线性 处 理性 能 。 


_Hopfield 网 络 


Hopfield 网 络 最 具有 吸引 力 的 性 能 是 可 以 实现 联想 记忆 的 功能 ， 其 网 络 结构 如 图 13-1 
所 示 。 








图 13-1 Hopfield 网 络 结构 示意 
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图 中 网 络 具有 r 个 输入 ，s 个 神经 元 ， 为 单 层 的 全 反馈 结构 。 每 个 神经 元 的 输出 又 与 
其 他 神经 元 的 输入 互 连 ， 通过 连接 权 值 构成 神经 元 的 输入 ， 在 这 种 结构 下 必然 有 六 *， 即 
网 络 输入 的 数目 与 输入 层 神经 元 的 数目 是 相等 的 。 

按照 传递 函数 的 不 同 ， 还 可 以 分 为 离散 Hopfield 网 络 ( Discrete Hopfield Network， 简 
称 DHNN ) 和 连续 Hopfield 网 络 ( Continuous Hopfield Network， 简 称 CHNN )。 Hopfield 
网 络 的 应 用 范围 很 广 ， 包 括 图 像 处 理 、 语 音 处 理 、 数据 查询 、 容 错 计算 、 模 式 识别 、 模 式 
分 类 等 方向 ， 本 节 对 两 类 Hopfield 神经 网 络 进行 介绍 。 


13.1.1 离散 Hopfield 网 络 模型 


Hopfield 最 早 提出 的 反馈 网 络 采用 二 值 传递 函数 ， 神经 元 的 输出 只 有 0 或 1 两 个 值 ， 
对 应 于 图 13-1 中 的 传递 函数 /为 硬 限 值 函数 ， 因此 称 为 离散 Hopfield 网 络 。 离 散 Hopfield 
网 络 中 ， 神 经 元 的 输出 为 0 或 1， 分 别 表示 神经 元 处 于 抑制 或 者 激活 状态 。 

假设 Hopfield 中 包含 = 个 神经 元 ， 从 神经 元 ) 输出 到 神经 元 ; 输入 的 互 连 权 值 表示 为 
5 任意 神经 元 ; 在 :时 刻 传递 函数 的 输入 表示 为 ww(D) ， + 时刻 的 输出 表示 为 w(r) ， 偏 差 
值 为 训 ， 则 :时 刻 的 传递 函数 输入 可 以 表示 为 ， 


局 OO = 六 wwi(D+ 训 


7 
对 应 神经 元 的 输出 状态 为 
w+D= 和 (wuw)) 


其 中 传递 函数 了 可 以 取 阶 跃 函数 或 者 符号 函数 。 如 果 取 符号 函数 ，Hopfield 网 络 的 神 
经 元 输出 w+1) 取 离散 值 1 或 者 -1， 即 ， 


1 立 w+ >0 
w+D= 人 
-1L，> ww(D+b<0 
握 

Hopfield 网 络 按照 动力 学 规则 运行 ， 其 工作 过 程 就 是 状态 的 演化 过 程 ， 从 初始 状态 按 
照 李 雅 普 诺 夫 能 量 函数 减 小 的 方向 演化 ， 直到 达到 稳定 状态 ， 得 到 稳定 的 网 络 输出 。 
Hopfield 网 络 的 运行 包括 串 行 和 并 行 两 种 工作 模式 。 

( 1 ) 串 行 工作 模式 。 在 任意 时 刻 妨 只 有 某 一 个 神经 元 ; 的 状态 发 生变 化 ， 而 其 他 神经 
元 的 状态 保持 不 变 。 这 种 工作 模式 也 称 为 异步 模式 。 

( 2 ) 并 行 工作 模式 。 在 任意 时 刻 ，， 可 以 有 多 个 神经 元 的 状态 同时 发 生变 化 ， 这 种 工 
作 模 式 也 称 为 同步 模式 。 

下 面 以 串 行 工作 模式 为 例 说 明 Hopfield 网 络 的 运行 步骤 。 

合 对 网 络 进行 初始 化 。 
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命 从 网 络 中 随机 选取 一 个 神经 元 。 

人 命 按 照 公式 计算 出 神经 元 的 输入 wu(D 。 

命 按照 公式 求 出 该 神经 元 的 输出 w(t+1) ， 此 时 网 络 中 的 其 他 神经 元 输出 保持 不 变 。 

癸 判断 网 络 是 否 达 到 稳定 状态 , 若 达到 稳定 状态 或 者 满足 给 定 的 条 件 ， 则 结束 训练 ， 
否则 转 到 第 兮 步 继续 执行 。 

反馈 网 络 的 稳定 性 是 一 个 非常 重要 的 指标 。 若 网 络 从 某 一 时 刻 后 , 状态 不 再 发 生变 化 ， 
就 称 网 络 达到 了 稳定 状态 。 此 时 ， 下 一 时 刻 的 网 络 输出 与 当前 时 刻 的 网 络 输出 相等 ， 用 公 
式 表示 为 ， 





w+D=w(CD) 
对 于 串 行 工 作 模式 的 网 络 ， 其 稳定 性 称 为 串 行 稳定 性 ， 对 于 并 行 工作 的 网 络 ， 其 稳定 
性 称 为 并 行 稳定 性 。 
1983 年 ,Coben 和 Grossberg 给 出 了 关于 Hopfield 网 络 稳定 的 充分 条 件 。 要 使 得 Hopfield 
网 络 存在 稳定 状态 ， 只 需 网 络 为 对 称 连接 ， 即 满足 : 
Wi 二 
且 神 经 元 自身 无 连接 ， 即 : 
wi=0 
因此 ,Hopfield 网 络 的 连接 权 值 矩 阵 通常 设 为 零 对 角 对 称 矩阵 。 不 过 ， 这 只 是 Hopfield 
网 络 稳定 的 充分 条 件 而 不 是 必要 条 件 ， 因此 实际 中 也 有 很 多 稳定 的 Hopfield 网 络 并 不 满足 


连接 权 值 矩 阵 是 零 对 角 对 称 矩阵 这 一 条 件 。 连接 权 值 短 阵 具有 对 称 性 的 Hopfield 网 络 如 图 
13-2 所 示 。 

















图 13-2， 零 对 角 对 称 权 值 短 阵 的 Hopficld 网 络 示意 图 


由 于 具有 反馈 ，Hopfield 网 络 是 一 个 非 线性 动力 学 系统 ， 网 络 按照 非 线性 动力 学 的 方 
式 运行 ， 即 按照 “能 量 函 数 ” 减 小 的 方向 进行 演化 ， 直到 达到 稳定 状态 。 其 网 络 的 “能 量 
函数 ”为 李 雅 普 诺 夫 函 数 ， 定 义 为 
E-- 立 立 和 凯 
js ] 
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其 中 同 为 让 j 神经 元 的 互联 权 值 ， 在 满足 以 上 参数 条 件 下 ， 李 雅 普 诺 夫 函 数 的 能 量 
在 网 络 运行 过 程 中 不 断 降 低 ， 最 终 达到 稳定 平衡 状态 。 为 了 说 明 这 一 问题 ， 下 面 以 神经 网 
络 中 的 任 一 神经 元 7 的 能 量变 化 为 例 进行 说 明 其 能 量 函 数 为 ， 





1 
局 =- 本 六 wwwj+bw 
Au 


从 :时 刻 至 寺 1 时 刻 此 神经 元 能 量 的 变化 量 为 : 
AE = 无 (+D- 已 (D) 


三 交 wwd+Dvw+bwC+D+ 六 Wi(Dw 一 旋 w(D) 


= JELA 


| > ww] 


站 
由 二 值 函数 的 定义 知 : 


晶 当 > w+ 记 和 0 时 ，wtt+D=-1， 因 此 有 AB <0; 


JI 本 


。 当 立 ww+b>0 时 ，wdC+D=1， 同 样 有 AE <0。 


JJ 
所 以 ， 网 络 的 能 量变 化 量 始终 是 非 正 的 。 因 此 按照 同一 规则 进行 状态 更 新 的 网 络 的 能 
量变 化 量 总 是 小 于 0 的 ， 也 即 ， 


AE<0，EUC+D< ECG) 


所 以 在 满足 参数 的 条 件 下 ，Hopfield 网 络 总 是 朝 着 能 量 减 小 的 方向 演化 ， 并 且 由 于 能 
量 函数 有 下 界 而 趋 于 稳定 状态 ， 此 时 的 状态 就 是 Hopfield 网 络 的 输出 。 

Hopfield 网 络 的 能 量 函数 含有 全 局 极 小 点 和 局 部 极 小 点 。 将 这 些 点 作为 记忆 状态 ， 就 
可 以 将 Hopfield 网 络 用 于 联想 记忆 ; 将 能 量 函数 作为 目标 代价 函数 ， 全 局 极 小 点 看 做 最 优 
解 ， 就 可 以 将 Hopfield 网 络 用 于 最 优化 计算 。 


13.1.2 连续 Hopfield 网 络 模型 


连续 Hopfield 网 络 在 拓扑 结构 上 与 离散 Hopfield 网 络 相同 , 只 是 神经 元 的 传递 函数 采 
用 连续 函数 。 在 连续 Hopfield 网 络 中 ， 各 神经 元 的 输入 、 输 出 均 为 连续 模拟 量 ， 各 神经 元 
采用 并 行 工作 模式 ， 这 种 结构 和 生物 神经 系统 中 大 量 存在 的 神经 反馈 回路 是 一 致 的 ， 并 且 
非常 适 于 利用 模拟 电子 电路 进行 实现 .1984 年 ,Hopfield 利用 模拟 电子 电路 实现 了 Hopfield 
网 络 ， 并 将 其 应 用 于 最 优化 问题 的 求解 ， 成 功 地 解决 了 TSP 问题 。 

连续 Hopfield 神经 网 络 结构 模型 用 电路 可 以 表示 为 图 13-3 所 示 的 形式 。 

可 以 看 到 ， 网 络 中 的 每 个 神经 元 都 可 以 看 做 是 由 运算 放大 器 及 其 相关 电路 组 成 的 ， 其 
中 任意 一 个 运算 放大 器 ;i( 即 神经 元 ; ) 都 有 两 组 输入 : 一 组 是 恒定 的 外 部 输入 ,用 五 表示 ， 
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相当 于 运算 放大 器 的 电流 输入 ; 另 一 组 是 来 自 其 他 运算 放大 器 的 反馈 连接 ， 比 如 其 中 任意 
两 个 运算 放大 器 i 与) 之 间 的 连接 权 值 ， 用 Wi 表示 。 以 上 表示 运算 放大 器 的 输出 电压 ， 疙 
表示 运算 放大 器 的 输入 电压 ， 它 们 之 间 的 关系 为 : 





=yGu) 























图 13-3 ”电路 形式 的 连续 Hopfield 网 络 结构 


其 中 /为 神经 元 及 运算 放大 器 的 传递 函数 ， 通 常 采用 sigmoid 函数 ， 即 : 
1 
(+e“) 





了 00 = 


连续 Hopfield 网 络 在 时 间 和 数值 上 都 是 连续 的 ， 各 神经 元 处 于 同步 工作 模式 下 ， 利 用 
电路 理论 中 的 基 尔 霍 夫 电流 定律 可 以 给 出 网 络 满足 的 方程 如 下 


du _ 忆 丰 
Ci- 二 =》 wii 一)+ 大 一 一 一 
-wo 总 


其 中 ，wWi = 闷 。 对 于 稳定 的 连续 Hopfield 网 络 ， 权 值 矩 阵 同 样 需要 满足 对 称 性 ， 即 


中 


几 =wi wwi=0 


连续 Hopfield 网 络 的 李 雅 普 诺 夫 能 量 函数 定义 如 下 
NAN 从 


: 
E=- 之 wmw+> 人 六 op- 症 mm 
tl 


所 各 和 
其 中 ， 工 - 款 +w， -为 传 递 函数 的 反 函 数 。 
1 Rio 所 
可 以 证 明 ， 如 果 网 络 神经 元 的 传递 函数 是 sigmoid 函数 ， 并 且 网 络 连接 权 值 矩阵 为 零 
对 角 对 称 阵 ， 则 网 络 的 李 缆 普 诺 夫 能 量 将 随时 间 变 化 而 单调 下 降 或 保持 不 变 ; 并 且 ， 当 且 
仅 当 输出 电位 随时 间 的 变化 不 变 时 ， 网 络 能 量 不 变 。 
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另 一 方面 ， 因 为 能 量 函 数 是 有 下 界 的 ， 所 以 ， 连 续 Hopfield 网 络 也 是 稳定 的 ， 其 稳定 
点 必定 位 于 能 量 函 数 的 下 界 ， 即 极 小 值 处 。 

连续 Hopfield 网 络 模型 对 生物 神经 元 模型 做 了 很 多 的 简化 , 但 仍然 突出 了 生物 神经 系 
统 的 一 些 主要 特性 ， 包 括 以 下 几 点 。 

(1 ) 连续 Hopfield 网 络 的 神经 元 传输 特性 具有 sigmoid 特性 。 

( 2 ) 在 神经 元 之 间 以 反馈 的 方式 存在 着 大 量 的 兴奋 和 抑制 性 互 连 ， 反 映 了 真实 生物 神 
经 系统 的 特性 。 

( 3 ) 既 有 代表 产生 动作 电位 的 神经 元 ， 又 有 代表 渐进 方式 工作 的 神经 元 ， 保 留 了 动态 
和 非 线 性 这 两 个 重要 的 计算 特性 。 

连续 Hopfield 网 络 主要 用 于 优化 计算 领域 。 在 实际 应 用 中 ， 对 于 任何 一 个 系统 ， 其 目 
标 函数 定义 为 能 量 函 数 ， 那 么 总 可 以 通过 连续 Hopfield 网 络 对 其 进行 求解 。 

通过 神经 网 络 这 一 动态 系统 给 出 初始 估计 点 ， 然 后 随 着 网 络 的 运动 传递 找到 能 量 函数 
的 最 小 点 ， 这 样 就 可 以 利用 连续 Hopfield 网 络 求解 大 量 的 最 优化 计算 问题 。Hopfield 网 络 
的 这 一 项 能 力 是 具有 开拓 性 的 。 


13.1.3 ”联想 记忆 


联想 记忆 ( Associative Memory ) 是 人 工 神经 网 络 理论 的 一 个 重要 组 成 部 分 ,将 人 工 神 
经 网 络 用 于 模拟 生物 神经 系统 的 记忆 功能 ， 是 模式 识别 、 智 能 控制 以 及 人 工 智能 领域 的 一 
个 重要 课题 。 它 主要 利用 神经 网 络 的 容错 性 ， 将 不 完整 的 、 畸 变 的 、 污 损 的 输入 样本 恢复 
为 完整 的 原型 。 由 于 Hopfield 网 络 能 够 模拟 生物 神经 网 络 的 记忆 功能 ， 因 此 常常 被 称 为 联 
想 记忆 网 络 。 

所 谓 联想 记忆 , 是 指 从 一 种 事物 联系 到 相关 的 另 一 种 事物 的 能 力 。 联 想 的 基础 是 记忆 ， 
也 就 是 将 输入 信息 存储 起 来 ， 再 在 某 些 需要 的 场合 ， 按 某 种 方式 将 相关 信息 取出 。 它 类 似 
计算 机 的 存 取信 息 的 过 程 ， 计 算 机 是 按 地 址 存 取 ， 而 神经 网 络 的 信息 存 取 则 是 基于 内 容 的 
存 取 。 记 忆 地 址 通过 记忆 内 容 的 部 分 来 识别 ， 信 息 分 布 于 生物 记忆 的 内 容 中 ， 而 不 是 某 个 
固定 的 地 址 。 

Hopfietd 网 络 通过 神经 元 之 间 的 权 值得 到 事物 间 的 联系 ， 各 神经 元 之 间 的 权 值 共 同 表 
现 为 神经 网 络 的 联想 记忆 功能 。 这 种 分 布 式 存储 能 够 存储 较 多 的 模式 ， 从 而 在 一 定 程度 上 
具有 恢复 不 完整 信息 的 功能 。 因 而 可 以 应 用 于 信号 复原 、 图 像 复原 等 领域 。 

联想 记忆 的 工作 过 程 通 常 分 为 两 个 阶段 : 一 是 记忆 阶段 ， 二 是 联想 阶段 。 
1. 记忆 阶段 

所 谓 的 记忆 阶段 就 是 设置 网 络 的 权 值 ， 使 其 具有 若干 个 稳定 的 平衡 状态 ， 这 些 稳定 的 
平衡 状态 称 为 吸引 子 ( Attractor )， 吸 引子 具有 一 定 的 吸引 域 ( Basin of Attraction )。 吸 引子 
的 吸引 域 就 是 能 够 稳定 收敛 到 该 吸引 子 的 所 有 初始 状态 的 基 和 ， 其 大 小 用 半径 来 描述 。 

从 图 形 上 来 看 ,吸引 子 也 就 是 网 络 能 量 函 数 的 极 小 值 点 ， 如 图 13-4 所 示 ， 记 忆 过 程 就 
是 将 记忆 和 存储 的 模式 映射 为 网 络 吸引 子 的 过 程 。 
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ED 








图 13-4 网络 吸引 子 与 吸引 域 示意 


2.， 联想 阶段 

联想 过 程 就 是 给 定 输入 模式 ， 网 络 按照 动力 学 的 演化 规则 运行 到 稳定 状态 ， 收 伊 到 吸 
引子 ， 从 而 回忆 起 存储 模式 的 过 程 。 

对 于 一 个 具有 联想 记忆 功能 的 网 络 ， 其 吸引 子 的 数量 就 代表 了 网 络 的 记忆 容量 
( Memory Capacity ) 或 存储 容量 ( Storage Capacity )， 也 就 是 在 一 定 的 联想 出 错 概率 容 限 下 ， 
网 络 中 存储 互 不 干扰 样本 的 最 大 输入 。 存储 容量 的 大 小 与 联想 记忆 的 允许 误差 、 网 络 结构 、 
学 习 方式 ， 以 及 设计 参数 有 关 。 

另外 ， 吸 引 域 是 衡量 网 络 容错 性 的 指标 ， 吸 引 域 越 大 ， 容 错 性 就 越 好 ， 或 者 说 网 络 的 
联想 能 力 就 越 强 。 

Hopfield 网 络 具有 稳定 的 平衡 状态 ， 欲 将 其 作为 联想 记忆 网 络 之 用 时 ， 需 要 设计 和 训 
练 其 权 值 ， 使 吸引 子 存储 记忆 模式 。 常 用 的 设计 和 学 习 算法 包括 外 积 法 、 投 影 学 习 法 、 伪 
逆 法 ， 以 及 特征 结构 法 等 。 

设 有 疾 个 样本 存储 向 量 ， 分 别 为 xxa，…xme 其 中 : 

区 = 人 2 


2 = {Z12,X22，Xm2] 


EXm 一 {XimyX2m，mm} 
将 这 普 个 样本 向 量 存储 入 Hopfield 网 络 之 中 ， 则 网 络 第 请 了 两 个 节点 之 间 的 权 值 为 : 
从 全 党 当 iz# 时 
革 0 当 i= 时 
其 中 ， 扩 1，2，.…，mi 证 了 分别 是 样本 向 量 xx 的 第 i 了 个 分 量 总， xi 的 下 标 。 


对 联想 存储 器 的 检索 过 程 如 下 。 
全 初始 化 网 络 状态 ， 给 定向 量 大 = {zux2…*xm}j， 将 其 设 定 为 网 络 的 初始 状态 。 各 


个 节点 的 初始 状态 分 别 为 : 
(DOD= zj ， 了 =12…m 
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僵 按照 迁 代 公式 进行 检索 计算 。 公 式 为 : 
ZiC+D=7[Zwy(OD-b 
其 中 /为 传递 函数 。 
全 网 络 输出 。 和 迭代 完毕 ， 此 时 网 络 状态 即 为 所 需要 的 输出 。 
在 此 过 程 中 ， 网 络 最 终 达到 的 状态 就 是 利用 给 定向 量 进行 联想 记忆 的 结果 。 这 个 过 程 
表明 ， 即 使 是 给 定 的 输入 向 量 并 不 完全 或 者 不 正确 ， 也 能 够 通过 网 络 找到 正确 的 结果 。 这 
等 效 于 信号 处 理 中 的 反 卷 积 信号 复原 的 效果 。 


13.1.4 Hopfield 网 络 结构 


Hopfield 网 络 的 结构 如 图 13-5 所 示 。 

其 中 ，a'(b)=satlins(LW al(k-D+z) ， 为 Hopfield 网 络 传递 函数 在 上 时 刻 的 输出 ， 
当 人 =0 时 ，a' (0)= 忆 。 如 前 一 节 所 述 ， 输 入 忆 仅 仅 作为 网 络 的 初始 条 件 。 

Hopfield 网 络 的 传递 函数 为 饱和 线性 传递 函数 , 函数 名 为 satlins, 其 传输 曲线 如 图 13-6 
所 示 。 





己 有 
TI a(0) 
4 
SA 
初始 条 件 对 称 饱和 线性 层 asatlinstm) 
图 13-5 Hopfield 网 络 结构 图 13-6 satlins 传递 函数 


当 输 入 小 于 -1 之 时 ，satlins 函数 输出 -1;， 当 输入 在 -1 到 +1 之 间 时 ， 输 出 等 于 输入 ; 
当 输入 大 于 1 时 ， 函 数 输出 为 1。 

Hopfield 网 络 是 一 种 多 输入 的 非 线性 动态 系统 ， 以 输入 样本 向 量 为 初始 条 件 ， 输 出 通 
过 反馈 回 到 输入 端 ， 在 多 次 重复 迭代 之 后 使 网 络 达到 稳定 状态 。 对 应 每 一 组 输入 向 量 即 初 
始 条件 ， 网 络 都 会 收敛 到 对 应 的 极 小 值 点 ， 这 也 是 Hopfield 网 络 联想 记忆 的 原理 。 


Elman 反馈 神经 网 络 { 以 上 简称 为 ElIman 网 络 ) 是 一 种 带 反馈 的 两 层 神经 网 络 ， 反 馈 
连接 从 第 一 层 输出 连接 到 输入 端 。 此 反馈 连接 使 得 Elman 网 络 能 够 用 来 检测 和 生成 时 变 模 
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式 。 一 个 双 层 Elman 网 络 的 结构 如 图 13-7 所 示 。 




















有 上 5 总 ET 


输入 反馈 tansig 层 输出 parelin 层 
图 13-7 ”Elman 网 络 结构 


其 中 : 
al =tansig(LWTP+ZEHTpak-D+BbD 
a2(6)= purelin(LW zial(k)+Bb2) 


从 图 13-7 中 可 以 看 到 ，Elman 网 络 的 隐 层 也 即 反馈 层 的 神经 元 采用 tansig 传递 函数 ， 
而 输出 层 采 用 线性 传递 函数 。 这 种 传递 函数 的 组 合 使 得 ElIman 网 络 能 够 在 有 限 的 时 间 内 以 
任意 精度 逼近 任意 函数 ( 具有 有 限 个 不 连续 点 )。 唯一 的 要 求 是 其 隐 层 中 必须 包含 足够 多 
的 神经 元 ， 隐 层 中 神经 元 的 数目 越 多 ， 网 络 逼 近 复杂 函数 的 能 力 就 越 强 。 

需要 指出 的 是 ，Elman 网 络 与 常规 的 两 层 BP 网 络 的 不 同 之 处 在 于 ，Elman 网 络 的 隐 
层 是 有 反馈 的 。 运 行 过 程 中 ， 它 保存 上 一 步 的 运算 结果 ， 并 反馈 到 输入 端 ， 应 用 于 这 一 步 
的 计算 。 因 此 ， 即 使 是 两 个 具有 相同 权 值 和 偏差 的 Elman 网 络 ， 在 一 定 的 时 间 内 给 定 相同 
的 输入 ， 由 于 两 个 网 络 具 有 不 同 的 反馈 状态 ， 执行 的 最 终结 果 可 能 也 是 不 同 的 。 

此 外 ，Elman 网 络 也 可 以 用 做 信息 存储 ， 因 此 Elman 网 络 既 支持 学 习 空域 模式 ， 同 时 
也 支持 学 习 时 域 模 式 。 


反馈 神经 网 络 的 MATLAB 实现 
本 节 我 们 介绍 MATLAB 神经 网 络 工具 箱 中 与 反馈 神经 网 络 相关 的 主要 函数 。 


13.3.1 设计 Hopfield 网 络 


MATLAB 工具 箱 中 用 于 设计 Hopfield 网 络 的 对 应 函数 为 newhopo 函数 需要 给 定 一 组 
目标 平衡 点 ， 以 矩阵 形式 T 表示 ，newhop 返回 反馈 网 络 的 权 值 和 偏差 。 生 成 的 网 络 能 够 
保证 对 于 给 定 的 目标 期 望 向 量 包 含 稳定 平衡 点 ， 但 是 也 可 能 包含 一 些 伪 平 衡 点 。 设 计 中 需 
要 使 得 网 络 中 的 伪 平 衡 点 越 少 越 好 。 

newhop 函数 的 调用 格式 为 : 





288 > 入 基 


第 13 章 “反馈 神经 网 络 





met = newhop (了 ) 


其 中 ，7 为 代表 给 定 的 目标 平衡 点 的 向 量 。 

网 络 生成 之 后 ， 可 以 通过 与 一 个 或 多 个 输入 向 量 对 其 进行 检验 。 如 果 输 入 向 量 与 目标 
平衡 点 距离 较 近 的 话 ， 将 能 够 找到 需要 的 目标 平衡 点 。 如 同 图 13-7 中 显示 的 一 样 ， 输入 向 
量 是 以 批 处 理 的 模式 整体 输入 的 ， 网 络 将 输出 反馈 到 输入 端 ， 同 时 将 输出 向 量 与 目标 向 量 
比较 ， 从 而 决定 将 如 何 进行 调整 。 

通过 对 输入 向 量 进行 批 处 理 ， 可 以 较 快 地 检测 网 络 的 性 能 。 首 先 需要 检验 目标 平衡 点 
向 量 是 否 确实 包含 在 网 络 中 ， 其 次 可 以 试验 其 他 输入 向 量 ， 以 此 确定 网 络 的 目标 平衡 点 的 
吸引 域 ， 以 及 网 络 是 否 存在 伪 平衡 点 。 

下 面 举例 说 明 Hopfield 网 络 的 设计 过 程 。 


【 例 13-1】 Hopfield 网 络 设计 实例 。 利 用 下 面 定义 的 目标 样本 向 量 ， 设 计 一 个 具有 
两 个 稳定 平衡 点 的 三 维 Hopfield 网 络 。 
解 ; @@ 定义 两 个 代表 目标 平衡 点 的 三 维 目标 向 量 。 输 入 如 下 命令 ; 





Tz=[I-1-ll1i1-11， 
输出 结果 为 : 
Tz=-1 1 

-1 -1 

二 


全 调用 newhop 函数 生成 网 络 。 输 入 命令 ， 

net = newhop(T) 

然后 利用 此 平衡 点 目标 向 量 检验 设计 的 网 络 。 输 入 命令 : 

Ai = Ti; 

[Y,Pf,Af] = sim(net,2,[] ,Ri) 7 

Y 

对 于 网 络 没有 输入 的 情形 ( 如 此 处 的 Hopfield 网 络 )， 需 要 将 sim 函数 的 第 2 个 参数 
设 为 2。 输 出 保存 在 Y 中 ， 产 生 的 结果 如 下 : 


Y =-1 
-1 -1 
工 工 


可 见 ， 该 网 络 确实 能 够 在 给 定 的 设计 点 处 得 到 稳定 的 平衡 。 

全 下 面 重新 给 定 网 络 初始 输入 条 件 ， 对 网 络 进行 仿真 。 输 入 命令 : 

Ai = {[-0.9; -0.8; 0.7]); 

此 输入 向 量 与 第 一 个 设计 点 比较 接近 ， 因 此 可 以 预期 网 络 将 会 收敛 到 第 一 个 平衡 点 。 
输入 命令 如 下 查看 结果 : 


[Y,Pf,RAf] = sim(net, fl 5},，{} Ri) 
Yf1} 
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可 以 看 到 ， 网 络 确实 如 预期 地 收敛 到 了 第 一 个 稳定 平衡 点 。 我 们 希望 网 络 对 所 有 的 输 
入 都 能 够 收敛 到 期 望 的 稳定 平衡 点 ， 但 是 由 于 Hopfield 网 络 有 可 能 存在 伪 平 衡 点 ， 因 此 并 
下 是 总 是 可 以 得 到 期 望 的 结果 。 这 一 点 会 在 后 面 实 例 中 进行 介绍 。 


13.3.2 ”Elman 网 络 的 创建 与 仿真 


利用 MATLAB 神经 网 络 工具 箱 函数 newelm 可 以 创建 一 个 两 层 或 多 层 的 ElIman 网 络 。 
通常 隐 层 中 采用 tansig 传递 函数 ， 输 出 层 采 用 purelin 传递 函数 。 

网 络 的 默认 BP 训练 函数 为 rainbfg， 也 可 以 选择 trainlm， 但 是 它 的 训练 速度 太 快 ， 在 
Elman 网 络 中 性 能 并 不 是 很 好 。 默 认 的 BP 学 习 规则 为 learmngdm， 默 认 性 能 函数 为 mseo 

一 旦 网 络 创建 完毕 ，, 其 权 值 和 偏差 就 通过 Nguyen-Widrow 方法 实现 初始 化 ,对 应 函数 
为 ininpw。 下 面 举 例 说 明 。 

【 例 13-2】 Elman 网 络 设计 实例 。 设 计 一 个 Elman 网 络 并 进行 仿真 。 
解 ， (@) 直接 采用 newelm 命令 生成 网 络 。 输 入 命令 ， 

net = newelm([0 1],[5 1],{'tansig'，'1ogsig'))7 

此 网 络 隐 层 中 包含 5 个 神经 元 ， 采 用 的 传递 函数 为 ansig， 输 出 层 中 只 有 一 个 神经 元 ， 
采用 的 传递 函数 为 logsig， 输 入 向 量 范围 为 0，1]。 

采用 随机 数 的 方式 生成 一 个 输入 向 量 ， 向 量 数值 中 只 包含 0 和 1。 输 入 命令 : 


B = xound(rand(1,8)) 

输出 结果 为 ， 

闻 二 这 昌 0 1 0 0 0 和 

将 其 转化 为 单元 排列 形式 。 输 入 命令 : 

Pseq -= con2seq(P) 

输出 结果 为 : 

Pseq = [0] [1] [0] [1 [1 [0] [01 [0] 


命 利用 sim 函数 对 网 络 进行 仿真 ， 得 到 输出 。 输 入 命令 : 


Y = sim(net,Psed) 


输出 结果 为 
Y = [0.0589] [0.36431] [0.09461 [0.4682] 【0.1861] [0.7120] 
[0.29161 [0.5146] 
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将 结果 Y 转化 为 向 量 形式 。 输 入 命令 : 


Z = seq2con(Y); 
zfl,1} 


输出 结果 为 : 


ans =0.0589 0.3643 0.0946 0.4682 0.1861 
0.5146 


输出 结果 表明 网 络 还 没有 达到 我 们 期 望 的 性 能 。 
13.3.3 训练 Elman 网 络 


可 以 利用 MATLAB 工具 箱 函数 train 或 者 adapt 对 Elman 
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0.7120 0.2916 


网 络 进行 训练 。 


当 应 用 train 函数 和 adapt 函数 对 网 络 进行 训练 时 ,每 一 次 迁 代 过 程 都 包括 以 下 几 个 步骤 。 
人 将 整个 输入 向 量 输入 网 络 ， 计 算得 到 其 输出 ， 同 时 与 目标 向 量 相 比较 ， 产 生 误差 


向 量 。 


人 通过 误差 反 向 传播 算法 ， 得 到 误差 函数 对 于 各 个 权 值 和 偏差 的 梯度 。 


命根 据 计 算得 到 的 梯度 值 ， 对 权 值 与 偏差 进行 修正 。 

函数 train 与 adapt 的 不 同 之 处 在 于 ， 前 者 通常 采用 BP 训 
训练 ， 而 后 者 则 应 用 learngdm 学 习 规则 函数 进行 权 值 修正 。 

Elman 网 络 的 可 靠 性 比 一 些 其 他 类 型 的 网 络 要 差 ， 这 是 因 
用 的 都 是 误差 梯度 的 近似 值 。 


练 函数 traingdx 对 网 络 进行 


为 它 在 训练 和 调整 过 程 中 使 


对 于 Elman 网 络 应 用 于 实际 问题 时 ， 相 比 其 他 网 络 ， 会 需要 更 多 的 隐 层 神经 元 ， 才 能 


获得 更 好 的 精度 。 如 果 神 经 元 数目 较 少 的 话 ，Elman 网 络 找到 


合适 的 权 值 与 偏差 的 机 会 会 


更 小 ， 因 为 训练 过 程 中 采用 的 是 近似 梯度 。 因 此 ， 在 创建 ElIman 网 络 时 给 定 足够 数量 的 神 


经 元 是 对 输入 进行 正确 划分 的 保证 。 


应 用 train 函数 对 网 络 进行 训练 ， 需要 提供 输入 向 量 与 目标 输出 向 量 。 利 用 有 动量 和 可 


变 学 习 速率 的 BP 训练 方法 对 网 络 进行 训练 。 下 面 我 们 接 上 面 


的 例子 ， 对 网 络 进行 训练 。 





【 例 13-3】 Elman 网 络 训练 实例 。 设 计 Elman 网 络 并 利 
进行 训练 
解 ; (了 给 定 训练 需要 的 输入 样本 向 量 。 输 入 命令 如 下 

P = round(rand(1,8)) 

输出 结果 为 : 

P?=1 0 全 已 1 1 1 0 

然后 定义 目标 输出 向 量 。 输 入 命令 : 

T = [0 (P(l:end-1)+P(2:end) == 2)] 


输出 结果 为 : 


用 输入 与 目标 输出 向 量 样本 
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此 处 ， 只 有 当 输入 向 量 中 的 元 素 值 连续 两 个 均 为 1 时 ， 输 出 才 为 1， 其 余 时 候 都 为 0。 
例 调用 newelm 函数 生成 一 个 隐 层 包含 5 个 神经 元 的 ElIman 网 络 。 输 入 如 下 命令 


net = newelm([0 1],[5 1],{'tansig'，'logsig')) 7 
应 用 train 函数 对 网 络 进行 训练 ， 设 定 最 大 迭代 次 数 为 100。 训 练 结束 后 ， 对 网 络 进行 
仿真 ， 并 查看 输出 结果 。 输 入 如 下 命令 : 


Pseqa = con2seq(P) 1 

Tseq = con2seq(T) ; 

net ,trainparam.epochs=100; 
net = train(net,Pseq,Tseq) 1 
Y = sim(net,Pseq) 7 

2z = seq2con(Y); 





ztl,1}， 

aifftl = T - zfl,1)， 

输出 结果 为 

ans =0.1016 0.0585 “0.0022 ”0.0117 ”0.0935 ”0.8468 ”0.8141 
0.1269 


aiffl =-0.1016 -0.0585 -0.0022 -0.0117 -0.0935 0.1532 0.1859 
-0.1269 


在 弹出 的 nntraintool 窗口 中 单 击 “Performance” 按 钮 ， 可 以 查看 训练 过 程 中 误差 性 能 
的 变化 ， 如 图 13-8 所 示 。 


va Teneaprtemarct ea rpocn ia 





[一 ma 


asn Sea Er fned) 
可 











0 放 商 广 有 页 商 区 询 羡 
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图 13-8 ”训练 过 程 中 网 络 误差 性 能 的 变化 
从 图 13-8 可 以 看 到 , 网 络 输出 比较 好 地 收敛 到 期 望 的 目标 响应 , 最 终 的 输出 误差 diffl 
较 小 ， 证 明 经 过 训练 的 ElIman 网 络 是 能 够 解决 该 问题 的 。 


反馈 神经 网 络 应 用 实例 


13.4.1 ”二 神经 元 Hopfield 网 络 设计 
【 例 13-4〗】 ”二 神经 元 的 Hopfield 网 络 设计 实例 。 利 用 给 定 的 样本 向 量 设计 一 个 二 神 
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经 元 的 Hopfield 网 络 ， 该 网 络 具有 两 个 稳定 平衡 点 ， 然 后 对 设计 的 网 络 进行 仿真 。 
解 : 人 @ 定义 训练 需要 的 输入 样本 向 量 。 输 入 如 下 命令 ， 

了 到 [+l -17 -1 +1]7 

作 图 显示 输入 样本 向 量 。 输 入 命 

plot (T(1,:),T(2，:) rs) 


axis([-1.1 1.1 -1.1 1.1]) 
title('Hopfield Network State Space') 
xlabel('a(1)'); ylabel('a(2)'); 


绘 出 的 图 形 如 图 13-9 所 示 。 
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图 13-9 Hopfield 网 络 目标 稳定 平衡 点 
可 以 看 到 ， 网 络 两 个 预定 的 稳定 平衡 点 位 于 状态 空间 图 的 左上 角 和 右 下 角 。 
全 利用 newhop 函数 创建 Hopfield 网 络 。 输 入 命令 : 
net = newhop(T) 


可 以 用 目标 向 量 对 网 络 进行 测试 ， 如 果 生 成 的 网 络 没有 问题 ， 应 该 会 收敛 到 预定 的 平 
衡 点 位 置 。 输 入 命令 ， 


[Y,Pf,Afl = sim(net,2,[],T) 7 


Y=1 -1 
- 1 
确实 如 我 们 所 料 ，Hopfield 网 络 收敛 到 了 正确 的 平衡 点 。 
全 下 面 随机 选取 初始 点 ， 利 用 sim 函数 对 网 络 进行 仿真 ， 设 定 网 络 运行 步 数 为 20 
步 ， 然 后 查看 网 络 状态 是 否 收敛 到 预定 平衡 点 。 输 入 命令 : 


aa = {frands(2,1)]}7 
[y,Pf,Afj = sim(net,{1 20),{),a)y; 
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对 Hopfield 网 络 的 运行 过 程 绘图 显示 。 输 入 命令 : 


record = [cell12mat(a) cel1l2mat(y)]7 

start = cell2mat (a) 

holda on 

plot(starc(1,1) ,start(2,1)，'Px" ,recorG(1,:) ,recordQ(2,:)) 


绘 出 的 图 形 如 图 13-10 所 示 ， 可 以 看 到 ， 网 络 确实 收 仇 到 了 期 望 的 平衡 点 。 


Hopkeia Neinotk Size Spxce 
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图 13-10 “Hopfield 网 络 运行 情况 


全 选择 25 个 新 的 初始 点 ， 再 次 仿真 ， 并 查看 网 络 运行 情况 。 输入 命令 : 


color =- 'rgbmy' 

for i=1:25 
a = {ranqs(2,1)); $% 设 置 随机 初始 点 
fy,pf,RfE] = sim(net, (1 20) ,fa)7 # 网 络 仿真 
record=[cell2mat(a) cellj2mat(y)]7 s& 记 录 演 化 轨迹 


StarL=Cel12mat(a) 7 
plot(scart(1,1) ,starc(2,1)，kx' 


record(1,:) ,recorda(2,:),color(rem(i,5)+1) ) % 绘 制 演化 轨迹 图 
end 


绘 出 的 图 形 如 图 13-11 所 示 。 
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可 以 看 到 距离 左上 角 近 的 初始 状态 ， 最 终 都 收敛 到 左上 角 的 平衡 点 ， 而 距离 右 下 角 近 
的 初始 状态 ， 最 终 都 收敛 到 了 右 下 角 的 平衡 点 。 这 说 明 Hopfield 网 络 确实 有 联想 记忆 的 能 
力 。 


13.4.2 ”Hopfield 网 络 中 的 伪 平衡 点 


如 前 面 所 述 ，Hopfield 网 络 中 可 能 会 存在 伪 平衡 点 ， 导 致 网 络 收敛 到 非 期 望 状 态 ， 下 
面 举例 说 明 。 

【 例 13-5】 考虑 【 例 13-4 】 中 二 神经 元 的 Hopfield 网 络 ， 用 特定 向 量 仿真 ， 考 察 其 
平衡 点 情况 。 
解 : 全 定义 目标 向 量 。 输 入 命令 : 


绘图 显示 网 络 状态 空间 的 平衡 点 。 输 入 如 下 命令 : 


plot(T(:,1),T(:,2)，*')7axis([-1.2，1.2，-1.2，1.2]); 
xlabel('a(1)'); ylabel('a(2)') 


绘 出 图 形 如 图 13-12 所 示 。 
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图 13-12 ”Hopfield 网 络 目标 稳定 平衡 点 


全 调用 newhop 函数 生成 Hopfield 网 络 。 输 入 命令 : 
net = newhop (T) 
然后 查看 生成 网 络 的 权 值 和 偏差 。 输 入 命令 : 


W=net .LW{1,I}， 
B=net .bf1l,1}， 
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W = 0.6925 -0.4694 
-0.4694 ”0.6925 


B = 0 
0 
合 利用 目标 向 量 了 对 网 络 进行 测试 ， 并 查看 网 络 的 目标 输出 。 输 入 命令 : 
Ri = Ti | 
[Y,Pf,RAf] = simtnec,2,[],Ai)7 
Y 
输出 结果 为 
Y=1 -1 
-1 和 


如 我 们 所 预期 ， 网 络 确实 收敛 到 了 期 望 的 平衡 点 。 
命 现在 随机 选取 初始 点 ， 利 用 sim 函数 对 网 络 进行 仿真 ， 看 它 是 否 能 够 稳定 到 期 望 
的 平衡 点 。 输 入 命令 : 


a = {rands(2,1))7 
[fy,Pf,RAfl] = sim(net,{l 50),{),a)7 


接 下 来 绘制 网 络 活动 过 程 。 输 入 命令 : 


record = [cell2mat(a) cell2mat(y)]; 

start = cell2matc(a) ; 

holda on 

plot (start(1,1) ,start(2,1)，'ro',record(1,:) record(2,:) ) 


绘 出 的 图 形 如 图 13-13 所 示 。 
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图 13-13 ”Hopfieid 网 络 运行 情况 


可 以 看 到 ， 运 行 之 后 ， 随 机 初始 点 最 终 稳 定 在 了 左上 角 的 平衡 点 。 在 这 一 次 测试 中 ， 
网 络 运行 收敛 的 结果 是 符合 期 望 的 。 我 们 可 以 加 入 更 多 的 测试 点 观察 网 络 运行 情况 。 
增加 5 个 初始 输入 点 ， 对 网 络 进行 测试 。 注 意 此 处 选取 的 5 个 初始 点 恰好 位 于 左下 - 
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右上 对 角 线 上 ， 与 两 个 平衡 点 距离 相等 。 输 入 命令 : 


plot(0,0，'ko'); 
P= [-1.0 -0.5 0.0 +0.5 +1.0; 
-1.0 -0.5 0.0 +*0.5 +1.0]; 
color = 'rgbmy'; 
for i=1:5 
a= {fP(:,i)]7 
[y,Pf,Af] = simtnet,{1 50),(),a); 
record= [cel12mat (a) cell2mat(y)]; 
start = cell2mat(a) 1; 
plot (start(1,1),start{2,1) ,kx'，..- 


recordQ{1,:) ,record(2,:),color(rem(i,5)+1)) 


drawnow 
end 


输出 的 图 形 如 图 13-14 所 示 。 
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% 设 置 初始 点 
% 网 络 仿真 
记录 演化 轨迹 


绘制 演化 轨迹 图 
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图 13-14 ”Hopfield 网 络 的 伪 平衡 点 


13-14 中 ， 新 增加 的 5 个 输入 点 都 位 于 左下 -右上 对 角 线 上 。 可 以 看 到 ， 随 着 网 络 运 
行 ，5 个 初始 点 最 终 都 收敛 到 了 状态 空间 的 中 心 点 ， 然 而 这 一 点 并 不 是 我 们 期 望 的 网 络 平 


衡 点 ， 因 此 也 说 明了 设计 的 Hopfield 网 络 中 是 包含 了 伪 平 衡 


个 缺点 。 


13.4.3 ”三 神经 元 Hopfield 网 络 设计 





， 这 是 Hopfield 网 络 的 一 


【 例 13-6】 三 神经 元 的 Hopfield 网 络 设计 实例 。 利 用 给 定 的 样本 向 量 设计 一 个 三 神 
经 元 的 Hopfield 网 络 ， 该 网 络 具有 两 个 稳定 平衡 点 ， 然 后 对 设计 的 网 络 进行 仿真 。 
解 ， @ 定义 两 个 三 维 的 目标 向 量 ， 对 应 网 络 的 两 个 期 望 平衡 点 。 输 入 命令 : 


Te [+l+lr .。。 -Li + .。 -1 -1]7; 


对 这 两 个 目标 向 量 在 网 络 状态 空间 中 的 位 置 进行 绘图 显示 。 输 入 如 下 命令 : 


axis([-11 -11 -11]) 
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set (gca, 'box''on'); axis manual; hold on; 
2ipt3fEU 人 te713， ee) 
title('Hopfield Network State Space') 
xlabel('a(1)'); Ylabel('a(2)'); zlabel("a(3) ) 7 
view([37.5 30])7 


绘 出 的 图 形 如 图 13-15 所 示 。 
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图 13-15 ”生成 的 Hopfield 网 络 状态 空间 

可 以 看 到 ， 网 络 两 个 平衡 点 位 于 状态 空间 立方 体 下 部 的 两 个 顶点 处 。 

全 利用 函数 newhop 创建 以 上 述 两 点 为 平衡 点 的 Hopfield 网 络 。 输入 命令 ， 

net = newhop(T); 

随机 定义 一 个 初始 点 ， 对 生成 的 Hopfield 网 络 进行 仿真 ， 预 期 网 络 经 过 运行 将 会 达到 
预期 的 稳定 平衡 点 。 输 入 命令 : 


a = {rands(3,1)]7 
[y,Pf,Aft] = sim(net, (1 10)，f),a)7 


对 网 络 的 运行 情况 进行 绘图 显示 。 输 入 命令 : 


record = [cell2mat (a) cell2mat(y)]7 
start = cell2mak(a); 
hold on 
plot3 (start (1,1) ,start(2,1) ,start(3,1)，bx'，.…- 
recora(1, :] ,record(2,:) ,recorG(3,:)) 
绘 出 的 图 形 如 图 13-16 所 示 。 可 以 看 到 , 网 络 经 过 运行 收敛 到 了 其 中 一 个 稳定 平衡 点 。 
合 随机 生成 25 个 初始 状态 点 ， 进 行 仿真 ， 并 绘图 观察 网 络 运行 过 程 。 输入 命令 : 


color = "rgbmy ' 





a = (ranas (3,1) 17 % 设 置 随机 三 维 初始 点 


[y,Pf,af] = sim(net,{1 10},f),a); s% 网 络 仿真 
record-= [cell2mat (a) cell2mat (Y)]; 。 % 记 录 演 化 轨迹 
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start=cell2mat (a) ; 
plot3(start (1,1) ,start(2,1),start(3,1)，'kx'，... 
recorad(1, :) ,recorG(2,:),record(3, :) ,color(rem(i,5)+1) ) % 绘 制 演化 轨迹 
enad 
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图 13-16 ”网 络 仿真 运行 情况 
绘 出 的 图 形 如 图 13-17 所 示 。 
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图 13-17 给 定 随机 初始 点 的 网 络 仿真 运行 情况 


可 以 看 到 ， 在 所 有 的 随机 初始 状态 下 ， 网 络 最 终 都 收 仇 到 了 期 望 的 两 个 稳定 平衡 点 。 
全 现在 选择 一 系列 特殊 的 初始 状态 点 ， 这 些 初始 状态 点 恰好 位 于 与 两 个 初始 平衡 点 

距离 相等 的 对 角 边 线 上 ， 如 图 13-18 所 示 ， 对 网 络 进行 仿真 ， 观 察 运行 情况 。 输 入 命令 ， 
P=[1.0 -1.0 -0.5 1.00 1.00 0.0; -.. 


0.0 0.0 0.0 0.00 0.00 -0. 
-1.0 1.0 0.5 -1.01 -1.00 0.0]; 





cla 
plot3(T(1,:),T(2,:)T(3，:) zx) 
Color = “rgbmy' 

for i=1:6 
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a = {Pt:,i)); $% 设 置 三 维 初始 点 
[y,Pf,af] = sim(net,{1 10},{],a); 。 % 网 络 仿真 
record= [cel12mat (a) cell2mat(y)]; S% 记 录 演 化 轨迹 


Starc=cell2mat(a) 
plot3(start(1,1) ,start(2,1) ,start(3,1) kx'， 
recorde(t1l, :) ,record(2,:)，,recora(3,:) ,color(rem(i,5)+1)) % 绘 制 演化 轨迹 
ena 


绘 出 的 图 形 如 图 13-18 所 示 。 
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图 13-18 ”给 定 特殊 初始 状态 点 的 网 络 仿真 运行 情况 


可 以 看 到 ， 在 这 些 初 始 状态 下 ，Hopfield 网 络 并 没有 收 伊 到 期 望 的 两 个 稳定 平衡 点 ， 
而 是 收敛 到 边线 中 点 所 对 应 的 网 络 状态 上 。 这 表明 设计 的 三 维 Hopfield 网 络 产生 了 不 期 望 
的 稳定 平衡 点 ， 也 即 伪 平 衡 点 。 


13.4.4 利用 Eliman 网 络 进行 振幅 检测 


Elman 网 络 可 以 用 来 识别 或 产生 空间 和 时 间 信 号 。 其 中 ， 振 幅 检测 就 是 应 用 EIman 网 
络 对 时 域 信号 进行 检测 和 分 类 的 例子 。 这 一 节 我 们 利用 实例 对 其 进行 说 明 。 

振幅 检测 需要 在 神经 网 络 输入 端 加 入 一 个 具有 特定 振幅 的 波形 ， 然 后 由 网 络 提取 波形 
的 振幅 特征 并 输出 。 这 是 一 个 比较 简单 的 应 用 实例 ， 但 是 可 以 用 来 较 清晰 地 说 明 Elman 网 
络 的 设计 方法 和 功能 。 

【 例 13-7】 ”Elman 网 络 振幅 检测 应 用 实例 。 设 计 一 个 ElIman 网 络 ， 对 输入 的 振幅 变 
化 的 时 变 信号 进行 振幅 检测 与 模式 分 类 。 
解 ，(i》 首先 定义 两 个 正弦 信号 ， 其 中 一 个 振幅 为 1， 另 一 个 振幅 为 2。 输 入 命令 : 

pl1 = sin(1:20): 

p2 = sin(1:20)*27 

然后 定义 期 望 输出 为 其 振幅 。 输 入 命令 : 


tl = ones(1,20); 
t2 = ones(1,20)*2; 


将 输入 、 输 出 分 别 合并 成 一 个 序列 ， 并 重复 一 次 ， 利用 这 个 较 长 的 波形 作为 Elman 网 
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络 的 训练 样本 向 量 。 输 入 命令 : 


P = [pl1 p2 pl p2]7 
ts Ttait2 DYt27 


将 输入 、 输 出 由 矩阵 形式 转换 为 序列 形式 。 输 入 命令 : 

pseq -= con2seq(p); 

Tseq = con2seq(t) 7 

加 创建 Blman 网 络 ， 对 于 每 一 步 输入 的 波形 信号 ， 输 出 其 振幅 。 此 网 络 为 单 输入 、 
单 输出 结构 。 反 馈 层 可 以 有 任意 个 神经 元 ， 这 要 根据 问题 的 复杂 度 而 定 。 如 果 期 望 网 络 性 
能 较 好 的 话 ， 就 需要 在 反馈 层 中 加 入 更 多 的 神经 元 。 

利用 newelm 函数 创建 网 络 ， 由 于 此 问题 相对 来 说 比较 简单 ， 因 此 在 反馈 层 中 设置 10 
个 神经 元 ， 同 时 定义 网 络 的 输入 、 输 出 变动 范围 为 -2, 2]， 训 练 函数 为 可 变 学 习 速 率 训练 
算法 ， 对 应 函数 为 raingdx， 输 入 、 输 出 层 传递 函数 分 别 为 ansig 和 purelin。 输 入 命令 ， 


net = newelm([-2 2],[10 1],{'tansig'，'purelin'),'craingdx'); 
设 定 最 大 训练 闪 代 次 数 为 1000， 期 望 目标 误差 为 0.01。 输 入 命 


net ,上 rainParam.epochs = 1000; 
net ,trainParam.goal = 0.01; 


侠 利用 train 函数 对 网 络 进行 训练 。 输 入 命令 : 
net = train(nect,Pseq,Tseg) ; 


除了 单 击 nntraintool 窗口 上 的 “Performace” 按 钮 绘制 误差 曲线 以 外 ， 也 可 以 利用 命 
令 方 式 绘制 误差 曲线 。 输 入 命令 ， 

semilogy (tr ,epoch,Er.perf) 

title('Mean Squared Error of Elman Network') 

xlabel('Epoch') 

ylabel('Mean Squared Error') 

绘制 的 误差 曲线 如 图 13-19 所 示 。 
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图 13-19 训练 过 程 中 网 络 的 误差 性 能 曲线 
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可 以 看 到 ， 经 过 训练 网 络 的 均 方 误差 水 平 降 到 了 le-2 量 级 。 如 果 增 加 训练 时 间 ， 网 
络 性 能 还 可 以 进一步 改善 。 

和合 下 面 对 网 络 进行 仿真 测试 ， 以 原始 输入 样本 作为 测试 向 量 ， 调 用 sim 函数 完成 仿 
真 并 绘图 。 输 入 如 下 命令 : 

a = sim(net,Pseq); 

然后 对 其 进行 绘图 显示 。 输 入 命令 


time = 1:length(p); 

plot (time,t，'--'…vtime,cat(2,af:})) 
titlel('Testing Amplitute Detection') 
xlabel('Time Step') 

ylabel('Target - - Output ---') 


输出 图 形 如 图 13-20 所 示 。 
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图 13-20 ”网 络 仿真 输出 结果 与 期 望 响应 














其 中 ， 期 望 响应 用 虚线 表示 ， 实 际 输出 用 实 线 表示 。 可 以 看 到 ， 网 络 对 输入 信号 振幅 
的 检测 是 完成 得 比较 好 的 ， 如 果 延 长 训练 时 间 的 话 ， 网 络 的 性 能 可 以 进一步 提高 ; 另 一 方 
面 ， 增 加 隐 层 中 神经 元 的 数目 也 可 以 改善 网 络 的 性 能 。 

全 下面 利 用 新 的 振幅 分 别 为 1.6 与 1.2 的 正弦 波形 输入 对 网 络 进行 仿真 ,查看 网 络 在 
遇 到 训练 中 不 曾 遇 到 过 的 输入 时 能 否 进行 正确 的 振幅 检测 。 输 入 命令 : 


p3 = sin(1:20)*1.6; 
t3 = ones(1,20)*1.6; 
p4 = sin(1:20)*1.27; 
t4 = ones(1,20)*1.2; 
pg = [p3 p4 p3 p4]; 
tg = [t3 t4 t3 4]; 


pgseq = con2seq(pg); 
利用 序列 pgseq 和 目标 序列 对 网 络 进行 仿真 。 输 入 命令 : 


Ba = sim(net,pgseq): 
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对 结果 进行 绘图 显示 。 输 入 命令 ， 

time = 1:length(pg); 

plot (time,tg,'--' vtime,cat(2,af:})) 

上 itle('Testing Generalization') 


xlabel('Time Step') 
Ylabel('Target - - output --- 小 


绘 出 图 形 如 图 13-21 所 示 。 
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图 13-21 ”新 输入 样本 下 的 网 络 仿真 输出 结果 与 期 望 响应 


图 中 期 望 响应 用 虚线 表示 ， 实 际 输出 用 实 线 表示 。 可 以 看 到 ， 网 络 对 输入 信号 进行 振 
幅 检测 的 效果 并 不 是 很 好 ， 网 络 输出 摆动 幅度 很 大 ， 并 且 不 能 与 期 望 响应 很 好 的 契合 。 这 
是 因为 训练 样本 中 不 包含 新 的 输入 样本 ， 也 就 是 说 ， 对 于 新 的 输入 样本 ， 网 络 是 未 经 过 训 
练 的 ， 对 于 这 种 情况 ， 利用 更 多 不 同 振幅 的 信号 对 网 络 进行 训练 可 以 改善 网 络 性 能 。 


小 结 


MATLAB 神经 网 络 工具 箱 中 ， 包 括 两 种 反馈 网 络 ， 即 Hopficld 网 络 和 Elman 网 络 。 
本 章 对 这 两 种 网 络 模型 结构 、 训 练 方法 以 及 设计 仿真 分 别 进行 了 介绍 ， 然后 通过 实例 介绍 
反馈 网 络 的 应 用 。 
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第 14 章 神经 网 络 优化 


前 面 各 章 介绍 了 几 种 基本 的 神经 网 络 类 型 ， 利 用 它们 还 可 以 衍生 一 些 优化 的 网 络 类 
型 。 例 如 ， 对 于 BP 网 络 ， 为 了 改善 收敛 速度 和 改进 其 局 部 极 小 点 ， 人 们 提出 了 不 同 于 基 
本 训练 算法 的 多 种 学 习 算法 : 为 了 寻求 更 好 的 模式 识别 性 能 ， 提 出 了 基于 有 限 样本 二 次 问 
题 最 优 解 的 支持 向 量 机 算法 ; 同时 还 提出 了 针对 神经 网 络 全 值 的 遗传 算法 优化 等 。 这 些 方 
法 的 发 展 ， 进 一 步 丰富 了 神经 网 络 的 功能 ， 同 时 也 使 得 其 训练 过 程 速度 更 快 ， 达 到 最 优 性 
能 的 概率 更 高 。 这 些 优化 措施 和 优化 类 型 也 是 提高 神经 网 络 性 能 的 方向 。 

BP 网 络 的 训练 算法 优化 在 前 面 章节 中 已 经 有 过 介绍 , 本 章 将 对 支持 向 量 机 、Boltzman 
机 与 模拟 退火 算法 ， 以 及 神经 网 络 的 遗传 算法 优化 等 相关 理论 进行 介绍 。 


支持 向 量 机 


支持 向 量 机 是 为 了 改善 前 向 网 络 的 几 个 问题 而 发 展 起 来 的 。 其 中 主要 包括 以 下 几 个 问 
题 。 

(1 ) BP 训练 算法 基于 梯度 算法 ， 因 此 优化 过 程 可 能 陷入 局 部 极 小 值 。 

( 2 ) 学 习 目 标 是 分 类 误差 对 所 有 样本 点 都 达到 最 小 ， 在 支持 向 量 机 理论 中 ， 这 属于 经 
验 风险 ， 只 能 够 保证 分 类 误差 对 有 限 个 样本 是 最 小 的 ， 还 有 改善 的 余地 。 

( 3 ) 神经 网 络 的 结构 设计 依赖 于 设计 者 的 先 验 知识 ( 例如 隐 层 中 神经 元 的 数目 )， 缺 
乏 科 学 的 设计 方法 。 

( 4 ) 无 法 控制 是 否 收敛 以 及 收敛 的 速度 。 

支持 向 量 机 是 由 Vapnik 等 人 于 1959 年 在 统计 学 习 理论 基础 上 提出 来 的 ， 是 模式 识别 
的 一 种 新 方法 。 它 主要 是 根据 有 限 的 样本 信息 在 模型 的 复杂 性 和 学 习 能 力 之 间 寻 求 一 个 最 
佳 的 折 中 ， 在 形式 上 类 似 于 多 层 前 向 网 络 ， 但 是 能 够 克服 一 些 多 层 前 向 网 络 的 固有 缺陷 。 
它 主 要 具有 下 列 几 个 优点 。 

(1 ) 专门 针对 有 限 样本 情况 而 设计 ， 目 标 是 得 到 现 有 信息 下 的 最 优 解 而 不 是 样本 趋 于 
无 穷 大 时 的 最 优 解 。 

( 2 ) 算法 最 终 转化 为 一 个 二 次 型 最 优 求解 问题 ， 理 论 上 可 以 得 到 全 局 最 优 解 。 

({ 3 ) 算法 将 实际 问题 通过 非 线性 变换 转换 到 高 维特 征 空间 ， 在 高 维 空间 中 构造 线性 判 
别 函数 来 实现 原 空间 的 非 线性 判别 函数 ， 这 一 特殊 性 质保 证 支持 向 量 机 具有 好 的 泛 化 能 
力 ， 并 且 巧 妙 地 解决 了 维 数 问题 ， 使 得 样本 复杂 度 与 维度 无 关 。 

基于 统计 学 习 的 支持 向 量 机 方法 能 够 从 理论 上 实现 对 不 同类 别 的 最 优 划分 ， 具 有 很 好 
的 泛 化 性 能 。 
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14.1.1 ”统计 学 习 理 论 


传统 统计 学 研究 的 是 无 限 样本 情况 下 网 络 的 极限 特性 , 而 Vapnik 等 人 提出 的 基于 有 限 
样本 的 统计 学 习 理 论 则 专门 研究 小 样本 情况 下 网 络 的 学 习 规律 的 理论 ， 从 更 本 质 上 研究 其 
学 习 问 题 ， 从 而 克服 前 向 网 络 的 固有 缺陷 。 

机 器 学 习 的 目标 是 根据 给 定 的 训练 样本 估计 系统 输入 与 输出 之 间 依 赖 关 系 ， 它 能 够 对 
未 知 样本 的 输出 做 出 尽 可 能 准确 的 预测 。 因 此 ， 可 以 定义 下 面 的 风险 函数 ， 对 学 习 效果 进 
行 评 估 。 

对 个 相互 独立 并 服从 同一 分 布 的 观测 样本 ， 假 定 系统 在 给 定 输入 为 * 的 情况 下 输出 
为 )， 且 变量 与 x 之 间 存 在 依赖 关系 ， 即 遵循 未 知 的 联合 概率 Fey)， 则 学 习 机 器 的 期 望 
风险 定义 为 : 








Row = [ov7Cow)dFon 


其 中 {7(Ccw)} 称 为 预测 函数 集 ，w 为 函数 的 广义 参数 ，L(y, (zx w)) 则 称 为 损失 函数 。 
具体 的 学 习 目标 设 定 为 使 得 风险 函数 最 小 ， 在 实际 应 用 中 ， 由 于 样本 数目 有 限 ， 因 此 


通常 用 Row(w)= 工 守 LCy ,7(xv) 来 求 期 望 风险 的 最 小 值 ， 也 即 经 验 风险 最 小 化 原则 。 经 


验 风险 最 小 化 原则 是 目前 绝 大 多 数 模式 识别 方法 的 基础 。 
Vapnik 等 人 通过 研究 得 出 结论 ， 对 指示 函数 ( 取 值 只 有 0 和 1 ) 中 的 所 有 函数 ， 经 验 
风险 和 实际 风险 之 间 以 一 定 概率 1-7 满足 如 下 关系 : 


Rom) = Rono(w+ anC: 六 二 jn(714)) 


其 中 , 是 函数 集 的 VC 维 ，VC 维 定义 为 学 习 机 器 能 够 正确 划分 的 任意 二 值 标识 的 最 
大 点 集 样 本 数目 。 它 是 衡量 学 习 机 器 复杂 程度 的 指标 ，VC 维 越 大 表示 此 学 习 机 器 越 复杂 。 
1! 是 样本 数 。 

上 面 等 式 右边 前 一 部 分 称 为 经 验 风险 ， 也 称 做 训练 误差 ， 后 一 部 分 称 为 置信 范围 ， 置 
信 范 围 不 仅 受 VC 维 数 的 影响 ， 同 时 也 是 置信 水 平 !-- 7 的 函数 ， 可 以 记 为 @(h/D) 。 通 党 
的 训练 是 使 得 经 验 风险 最 小 ， 但 是 由 于 样本 可 能 不 充分 ， 造 成 置信 范围 非常 大 ， 导 致 机 器 
的 适应 范围 很 窄 ， 也 就 是 泛 化 能 力 很 差 。 

为 解决 上 述 问题 ， 就 需 在 保证 分 类 精度 的 同时 ， 降 低 学 习 机 器 的 VC 维 ， 从 而 使 得 学 
习 机 器 在 整个 样本 集 上 的 期 望 风险 得 到 控制 ， 实 现 结构 风险 最 小 化 ( Stuctural Risk 
Minimization，SRM )。 这 正 是 支持 向 量 机 实际 所 采用 的 方法 。 


14.1.2 ”支持 向 量 机 ( SVM ) 理论 


支持 向 量 机 理论 最 初 来 源 于 对 数据 分 类 的 处 理 。 对 于 线性 可 分 的 二 值 分 类 ， 通 常 是 
造 一 个 超 平面 并 移动 它 ， 直 到 找到 一 个 合适 的 分 界线 为 止 。 这 种 激励 不 能 保证 分 割 平面 位 
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于 两 个 类 别 的 中 心 ， 也 就 是 说 ， 无 法 最 优化 决策 分 界线 。 

支持 向 量 机 则 很 好 地 解决 了 这 一 问题 ， 能 够 寻找 一 个 最 优 分 类 面 ， 使 得 该 超 平面 在 保 
证 分 类 正确 性 的 同时 ， 和 平面 两 边 的 空白 区 域 最 大 化 。 支持 向 量 机 分 为 线性 和 非 线 性 两 类 。 
下 面 分 别 介绍 。 


1. 线性 支持 向 量 机 

对 于 线性 可 分 问题 ， 如 图 14-1 中 所 示 的 上 下 两 组 样本 点 ， 通过 平行 直线 有 局] ， 互 ，H2 
都 可 以 成 功 地 分 开 ( 其 他 斜率 的 平行 线 也 与 之 类 似 j。H1 和 友 这 样 的 两 类 直线 之 间 的 距 
离 称 为 分 类 间隔 ， 相 比 于 刀 ! 和 /2， 甩 的 分 类 是 更 优 的 。 

所 谓 最 优 分 类 线 ， 是 使 两 类 的 分 类 间隔 都 最 大 化 的 分 类 线 。 能 够 把 两 类 样本 点 正确 无 
误 地 分 开 ， 是 保证 经 验 风险 最 小 化 ， 而 能 够 使 分 类 间隔 最 小 化 ， 则 是 使 得 置信 
这 就 是 结构 风险 最 小 化 的 体现 。 在 高 维 空间 中 ， 最 优 分 类 线 就 成 为 了 最 优 分 类 面 。 

和 人 








小 ， 


人 
人 


肌 〇 


图 14-1 ”最 优 分 界线 示意 图 


设 训练 样本 为 ii， 记 1，2，…，1， 对 应 的 期 望 输出 为 m ={+l-1， 其 中 +1 和 -1 代表 
两 类 的 类 别 标识 。 假 定 分 类 面 方程 为 wx+b=0。 为 了 使 得 分 类 面 为 所 有 样本 正确 分 类 且 
具备 分 类 间隔 ， 就 要 满足 下 列 约束 条 件 : 


yow+ 世 -1>0 
可 以 计算 出 分 类 间隔 为 : 


vv 十 放 x+b 2 


Te 
训练 的 目标 是 使 得 分 类 间 晤 | 最 大 化 也 即 | 必 最 小 化 。 于 是 将 最 优 分 类 问题 转 
化 为 下 列 约束 优化 问题 ， 求 下 式 的 最 小 值 


TI2 
ooo=3il 
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而 约束 条 件 为 : 
Ooaw+ 刀 -1>0 
采用 拉 格 朗 日 乘 子 法 ， 将 问题 转化 为 : 


志 世 
2= 革 中 - 半 wCow+g+ 袜 aa 


所 
因此 ， 目 标 就 转化 为 求 的 最 小 值 。 因 此 ， 分 别 对 w 和 必 求 偏 微分 ， 令 其 等 于 0， 则 
转化 为 一 个 简单 的 问题 ， 对 w 求 下 面 函 数 的 最 大 值 : 


2 
W(oO=》w -2 志 woiyuCum) 
邱 抹 


其 约束 条 件 为 荆 关 于 w 和 尹 的 梯度 均 为 0， 同 时 满足 w >0。 
如 果 wi 为 最 优 解 ， 则 
后 
即 为 最 优 分 类 面 的 权 系数 向 量 ， 此 权 向 量 是 训练 样本 的 线性 组 合 。 
上 述 问题 是 一 个 不 等 式 约束 下 求 二 次 极 值 的 问题 ， 可 以 证 明 ， 其 最 优 解 必须 满足 
et[xw+blw-U=0 


对 于 多 数 样本 ，w 取 0， 而 对 取 值 不 为 0 的 w' ， 则 必须 使 得 w(xw+ 刀 -1> 0 等 号 成 
立 ， 这 些 样本 就 称 为 支持 向 量 ( Support Vectors )。 也 就 是 图 14-1 中 标记 为 黑色 的 样本 点 。 


2， 非 线性 支持 向 量 机 

解决 感知 器 无 能 为 力 的 异 或 问题 , 一 种 方法 是 使 用 多 层 前 向 网 络 , 另 一 种 方法 则 是 将 输 
入 向 量 映射 到 一 个 高 维 的 特征 向 量 空间 , 并 且 在 该 特征 空间 中 构造 最 优 分 类 面 ， 这 就 是 支持 
向 量 机 方法 ， 它 能 够 避免 在 多 层 前 向 网 络 中 无 法 克服 的 一 些 缺陷 。 如 果 选 用 的 映射 函数 合适 
的 话 ， 在 大 多 数 输入 空间 线性 不 可 分 的 问题 是 可 以 在 高 维 的 特征 空间 中 进行 线性 划分 的 。 

在 低 维 空间 向 高 维 空间 的 转化 过 程 中 ， 由 于 空间 维 数 的 增长 ， 导 致 多 数 情况 下 难以 直 
接 在 特征 空间 直接 计算 最 佳 分 类 平面 ， 而 支持 向 量 机 通过 定义 核 函 数 ， 将 这 一 问题 巧妙 的 
转化 到 输入 空间 进行 计算 。 

在 引入 核 函数 的 情况 下 ， 支 持 向 量 机 的 形式 如 图 14-2 所 示 。 











图 14-2 ” 核 函数 支持 向 量 机 原理 
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其 中 ，K(xivzj) 即 为 核 函数 ， 核 函数 定义 了 两 个 输入 向 量 之 间 的 内 积 。 常 用 的 核 函 数 
包括 多 项 式 核 函数 、 高 斯 核 函 数 、Sigmoid 核 函 数 等 。 对 应 输出 函数 可 以 表示 为 : 





7 加 |euecore] 
各 

可 以 看 出 ， 支 持 向 量 机 求 得 的 决策 函数 形式 上 类 似 于 一 个 神经 网 络 ， 其 输出 是 若干 中 
间 层 节点 的 线性 组 合 ， 而 每 一 个 中 间 层 节点 对 应 于 输入 样本 与 一 个 支持 向 量 的 内 积 。 

当 采 用 径 向 基 核 函数 时 ， 支 持 向 量 机 就 是 一 种 径 向 基 函 数 分 类 器 ， 它 与 前 面 的 传统 径 
向 基 方法 的 区 别 在 于 使 用 了 支持 向 量 方法 ， 径 向 基 函 数 的 中 心 位 置 以 及 中 心 数目 、 网 络 权 
值 都 是 由 训练 过 程 中 自动 确定 的 。 


14.1.3 ”支持 向 量 机 实例 


MATLAB 神经 网 络 工具 箱 中 并 没有 支持 向 量 机 的 函数 和 实例 ,运行 本 节 中 的 实例 需要 
安装 本 书 附带 光盘 中 的 支持 向 量 机 SVM 工具 箱 ， 此 工具 箱 为 第 三 方 开放 工具 箱 ， 也 可 以 
从 http:Wwww.support-vectorneUsoftware.html 下 载 。 

在 MATLAB 中 安装 工具 箱 的 过 程 非常 简单 ， 执 行 步骤 如 下 。 

全 解压 缩 SVM-KMLzip 到 期 望 的 文件 夹 ， 最 好 选择 MATLAEB 安装 目录 下 的 toolbox 
文件 夹 。 

全 在 命令 窗口 中 选择 “File" 菜单 下 的 “Set Path” 选 项， 弹出 如 图 14-3 所 示 的 窗口 。 


FEZTZTRNIEIEESESEEESS 
Were tse aea omwaees 
na onedhpash 











图 14-3 “Set Path” 窗 口 


合 单 击 “Add with Subfolders” 按 钮 ， 在 其 中 选中 解压 缩 后 的 “SVM-KM” 文 件 夹 ， 
将 其 添加 到 MATLAB 配置 目录 中 。 

侠 单 击 “Save 按钮 保存 配置 ， 然 后 单 击 “Close” 按钮 ， 即 完成 此 工具 箱 的 安装 。 

安装 了 工具 箱 之 后 ， 就 可 以 进入 下 面 的 实例 操作 。 


【 例 14-1】〗 ”支持 向 量 机 分 类 实例 。 应 用 支持 向 量 机 对 100 个 二 维 高 斯 分 布 的 随机 样 
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本 点 进行 分 类 。 

解 ， 人 清空 数据 空间 。 在 MATLAB 命令 空间 中 输入 命令 ， 
close al1l 
必 1e 


接 下 来 创建 数据 样本 ， 输 入 命令 ， 





[Xapp,yapp,xtest,ytest]=datasets('gaussian',n,0,sigmal) 
Xapp=single(Xapp) ; 
[xapp]=normalizemeansta(Xapp) ; 


上 述 命令 中 调用 了 SVM-KM 工具 箱 中 的 函数 ， 产 生 100 个 高 斯 分 布 的 随机 样本 数据 
点 集 ， 这 些 数 据点 位 于 Xapp 中 。 输入 下 面 命令 对 样本 点 集 进行 绘图 显示 ， 
Plot (Xapp(:，,1) ,Xapp(:,2),，'.') ,axisl 【-3.5,3.5,-3.5,3.5]) 
绘 出 的 图 形 如 图 14-4 所 示 。 
ICERReemesamsssssss aa 
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图 14-4 ”输入 样本 点 集 
人 下面 调 用 svmclass 命令 通过 支持 向 量 机 对 输入 样本 点 集 进行 划分 。 


lambda = le-77; 

C = 10; 

kernel='gaussian' 

kerneloption=17 

[xsup,w'w0,pos,tps,alpha]=svmclass(Xapp,yapp,C,lambda,kernel,kernelopti 
并 ) 
和 Ypredapp = svmval {Xapp,xsup,w,w0,kernel kerneloption,1) 7; 

设置 SVM 核 函 数 为 gausssian 函数 ， 拉 格 朗 日 乘 子 边 界 为 10, lambda 是 QP 算法 中 用 
到 的 条 件 参数 ， 输 出 支持 向 量 即 为 xsup，w 与 w0 分 别 是 权 值 和 偏差 值 。 对 于 MATLAB 
中 的 命令 svmval 的 调用 格式 ， 读 者 可 以 通过 type 命令 查看 源 文件 。 

合 创建 一 个 二 维 网 格 ， 同 时 对 判决 函数 进行 验证 。 输 入 命令 ， 
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[xtest1l xcest2] = meshgrid([-1:.05:1]*3.5,[-1:0.05:11*3)7 
nn = length(xtest1) 

Xtest = [reshape(xtest1l ,nns*nn,1) reshape (xtest2 ,nnsnn,I)]7 
ypred=svmval (Xtest,xsup,w,w0,xernel， 

kerneloption, [ones (length(Xtest) ,1)]); 

ypred -= reshape(ypred,nn,nn); 


合 绘图 显示 分 类 结果 。 输 入 如 下 命令 : 


figure(1)7 

clfy 

$%contourf (xtest1,xtest2,Yypred,50);shading flar7 
holda on 

[cc,hh]=conktour (xtescl1,xtest2,Ypred,[-1 0 1]，k')7 
clabel(cc,hh); 

set (hh,，'Linewidth',1) 7 

hl=plot (Xapp (yapp==1,1),Xapp(Yyapp==1,2)，'+z") 17 
set (hl1，'LinewWidth' ,1) 7 
h2=plot(Xapp(yapp==-1,1),Xapp(yapp==-1,2)，Gb') 1; 
Set (h2，'LineWidth' 1) 

h3=plot (xsup(:，,1) ,xsup(:,2)，'ok') 7; 

set (h3, 'Linewidth',1);axis([-3.5 3.5 -3 3])7 


绘 出 的 图 形 如 图 14-5 所 示 。 
ITTRRReaaamasmssssssss 
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图 14-5 SVM 分 类 结果 





从 图 中 可 以 清楚 地 看 到 SVM 方法 确定 的 最 优 的 决策 分 界线 ， 以 及 +1，-1 两 条 等 值 线 


的 形状 。 
下 面 介绍 一 个 应 用 支持 向 量 机 实现 一 维 回归 的 实例 。 


【 例 14-2】〗 支持 向 量 机 回归 分 析 实例 。 应 用 支持 向 量 机 对 一 维 指数 正弦 函数 样本 点 


进行 回归 拟 合 。 


解 ，@ 清空 数据 空间 ， 定 义 一 维 样本 数据 ， 并 对 其 绘图 显示 。 在 MATLAB 命令 空间 中 
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输入 命令 ， 


clear al1 

tic 

an=507 

Xx=linspace(0,3,n) xx=jinspace(0,3,n) 





Y os (exp (x)) 1 yY=cos (exp(xx) ) ; 
figure(I) 

holda on7 

Pilot (xxvy，'g' xxvy， b+ 


绘 出 图 形 如 图 14-6 所 示 。 





图 14-6 ”一 维 输入 数据 样本 


人 @@ 设置 参数 ， 并 调用 svmreg 函数 进行 回归 。 输 入 如 下 命令 ， 


C = 0.0001; lambda = 0.000001; 

epsilon = .2; 

kerneloption = 0.01; 

kernel='gaussian' 

Verbose=17 

[xsup,ysup,w,w0]=svmreg(xivyivc， epsilon,kernel,， 
kerneloption, lambda,verbose) ; 


全 调用 symval 函数 对 数据 进行 绘图 显示 。 输 入 命令 . 


ITX = Svmval (xx,Xxsup,w,w0,kernel,kerneloption); 
h = plot (xx,rx, 'b'); set(h,'Linewiath' ,2)7 

h = piot(xsup,ysup, 'or'); set{(h,'Linewidth， 2) 7 
DP1lot (xx,rx+epsilon,'b--'); 

Plot (xx,zx-epsilon, 'b--'); hold off; 
title('Support Vector Machine Regression' ) 7 
xlabel('x');ylabel('y'); hold off 


绘 出 图 形 如 图 14-7 所 示 。 
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图 14-7 SVM 回归 结果 


从 图 14-7 中 可 以 看 到 ， 应 用 支持 向 量 机 很 好 地 实现 了 对 一 维 数据 样本 的 回归 拟 和 。 





加 玉 Botzmann 机 与 模拟 退火 算法 


20 世纪 80 年 代 ，Ackley、Hinton 等 人 以 模拟 退火 算法 为 基础 ， 在 Hopfield 模型 中 引 
入 了 随机 机 制 ， 提 出 了 Boltzmann 机 。Boltzmann 机 是 第 一 个 受 统计 力学 启发 的 多 层 学 习 
机 ,其 命名 来 源 于 Boltzmann 在 统计 力学 中 的 早期 工作 与 网 络 本 身 动态 分 布 行为 的 相似 性 。 
Boltzman 机 的 运行 机 制服 从 模拟 退火 算法 。 


14.2.1 Boltzmann 机 的 网 络 结构 


Boltzmann 机 结合 了 BP 网 络 和 Hopfield 网 络 在 网 络 结构 、 学 习 算法 和 动态 运行 机 制 
上 的 优点 ， 具有 多 层 的 网 络 结构 、 高 效 的 学 习 算法 ， 以 及 依 概率 方式 工作 的 动态 运行 机 制 。 

Boltzmann 机 由 输入 部 、 输 出 部 和 中 间 部 构成 。 输 入 部 和 输出 部 神经 元 通常 称 做 显 见 
神经 元 ， 是 网 络 与 外 部 交换 的 媒介 ， 中 间 部 神经 元 称 为 隐 见 神经 元 。 但 是 Boltzmann 机 没 
有 明显 的 网 络 层次 。 此 外 ，Boltzmann 机 的 神经 元 是 互联 的 ， 网 络 状态 按照 概率 分 布 进行 
变化 。 其 结构 如 图 14-8 所 示 。 








图 14-8 ”Boltzmann 机 结构 
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同 Hopfield 网 络 一 样 ，Boltzmann 网 络 中 的 每 一 对 神经 元 之 间 的 信息 传递 都 是 双向 对 
称 的 ， 即 w = wi， 并 且 自 身 不 存在 反馈 ， 即 wi = 0 。 在 网 络 学 习 期 间 ， 显 见 神经 元 被 外 
部 环境 所 约束 ， 因 而 处 于 某 一 特定 的 状态 之 下 ， 而 中 间 部 隐 见 神经 元 则 不 受 外 部 环境 的 约 
束 。 

Boltzmann 机 中 的 每 一 个 神经 元 都 具有 随机 的 兴奋 和 抑制 状态 ， 其 概率 取决 于 神经 元 
的 输入 。 神 经 元 结构 如 图 14-9 所 示 。 








图 14-9 ”Boltzmann 机 神经 元 结构 
任意 一 个 神经 元 的 数学 模型 表征 如 下 


本 = 定 ww 十 忆 
7 
首先 输入 进行 加 权 组 合 ， 神 经 元 输出 取 值 范围 为 [0,1]， 取 0 或 1 的 概率 依 输入 决定 。 
神经 元 输出 为 1 的 概率 : 
Pow =D=1/0+e“) 
神经 元 输出 为 0 的 概率 : 
Pw =0)=1-1/(+e“1) 
显然 ， 必 越 大 ， 则 输出 取 值 为 1 的 概率 越 大 ， 必 越 小 ， 则 输出 取 值 为 0 的 概率 越 大 。 
参数 了 称 为 网 络 的 温度 。7 升 高 时 ， 网 络 概率 随 的 变化 越 来 越 不 明显 ， 而 当 人 降低 时 ， 
几 稍 有 变动 则 神经 元 的 取 值 概率 就 会 变动 很 大 。 当 T 一 0 时 ， 激 励 函数 变 为 阶 跃 函数 ， 每 


个 神经 元 不 再 具有 随机 特性 ， 这 时 Boltzmann 机 就 退化 为 Hopfield 网 络 。 从 这 个 意义 上 来 
说 ，Hopfield 网 络 实际 上 是 Boltzmann 机 的 一 个 特例 。 


14.2.2 ”模拟 退火 算法 


模拟 退火 算法 ( Simulated Annealing，SA ) 是 从 物理 和 化 学 中 的 退火 过 程 类 推 而 来 的 。 
它 由 Metropolis 算法 和 退火 过 程 ( Annealing Procedure，AP ) 组 成 。Metropolis 算法 由 
Metropolis 于 1953 年 提出 ， 这 是 一 种 改进 的 MonteCarlo 算法 ， 该 方法 早期 用 于 在 给 定 温 
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度 下 原子 达到 平衡 状态 的 随机 仿真 计算 。“ 退 火 ” 是 物理 学 术语 ， 意 为 对 物体 加 温 后 再 冷 
却 的 处 理 过 程 。 

模拟 退火 算法 的 思路 是 : 首先 在 高 温 下 进行 搜索 , 此 时 各 个 状态 出 现 的 几率 相差 不 大 ， 
可 以 很 快 进 入 “热平衡 状态 "， 这 时 进行 的 是 粗 搜索 ， 大 致 找到 低能 区 域 ， 此 后 ， 随 着 温 
度 的 降低 ， 各 状态 出 现 的 概率 的 差距 逐渐 拉 大 ， 搜 索 精 度 不 断 提 高 ， 从 而 越 来 越 准确 地 找 
到 网 络 能 量 函数 的 全 局 极 小 点 。 

模拟 退火 算法 的 最 初 目的 是 寻找 代表 复杂 系统 的 代价 函数 的 全 局 最 小 值 。 这 种 方法 为 
解决 复杂 的 曲面 最 优 问题 提供 了 一 个 强 有 力 的 工具 。 在 此 算法 过 程 中 ， 系 统 的 误差 或 者 能 
量 函 数 绝 大 部 分 时 间 在 下 降 , 但 不 是 一 直下 降 , 即 误差 或 者 能 量 函数 向 着 减 小 的 方向 变化 ， 
但 有 时 也 朝 着 增 大 的 方向 变化 ， 这 样 就 可 以 跳出 局 部 极 小 点 ， 向 全 局 最 小 点 收 仇 。 

模拟 退火 算法 的 大 致 步骤 如 下 。 

合 随机 给 定 初始 状态 ， 设 定 合理 的 退火 策略 。( 选择 各 参数 值 、 初 始 温度 、 降 温 
规律 等 ) 

国 令 m= x+Axr ( Ar 为 小 的 均匀 分 布 的 随机 扰动 ) 计算 AE= E(x) 一 E(z)o 

侠 若 AE <0 ， 则 接受 x' 为 新 的 状态 ， 否 则 以 概率 已 =exp(-AE/(KT)) 接受 x ， 其 中 
大 为 玻 尔 效 曼 常数 。 具 体 做 法 是 产生 0 到 1 之 间 的 随机 数 a， 若 P>a 则 接受 x' ， 否 则 拒绝 
x"， 系 统 仍 停留 在 状态 x。 

合 重复 步骤 合 、 人 @ 直 到 系统 达到 平衡 状态 。 

侠 按 第 国 步 中 给 定 的 规律 降温 ， 在 新 的 温度 下 重新 执行 全 ~ 全 步 ， 直 到 T=0 或 者 
达到 某 一 预定 的 低温 。 

由 以 上 步骤 可 以 看 出 ，AE > 0 时 仍然 有 一 定 概率 ( 了 越 大 概率 越 大 ) 接受 x' ， 因 而 可 
以 跳出 局 部 极 小 点 。 理 论 上 说 ， 温 度 7 的 下 降 应 该 不 快 于 : 

TD=Tm /+innD, rt=1L2.3… 


其 中 力 为 起 始 高 温 ，: 为 时 间 变 量 。 常 用 的 公式 是 TO=arod-D ， 其 中 
0.85<x<0.98 。 

在 最 优化 问题 的 计算 中 , 模拟 退火 算法 具有 跳出 局 部 最 优 陷阱 的 能 力 , 因此 被 Ackley、 
Hinton Sejnowski 等 人 用 做 Boltzmann 机 的 学 习 算法 , 从 而 使 Boltzmann 机 克服 了 Hopfield 
网 络 经 常 收敛 到 局 部 最 优点 的 缺陷 。 在 Boltzmann 机 中 ， 即使 网 络 系统 落 入 了 局 部 最 优 的 
陷阱 ， 经 过 一 段 时 间 之 后 ， 它 还 能 够 跳出 来 ， 使 系统 最 终 收敛 到 全 局 最 优点 。 

模拟 退火 算法 在 求解 规模 较 大 的 问题 时 ， 还 存在 收敛 速度 慢 的 缺点 。 为 此 ， 人 们 对 模 
拟 退 火 算法 进行 了 各 种 改进 ， 包 括 并 行 模拟 退火 算法 、 快 速 模拟 退火 算法 等 ， 这 里 就 不 再 
一 一 獒 述 。 





14.2.3 Boltzmann 机 的 工作 原理 


同 Hopfield 网 络 一 样 ，Boltzmann 机 采用 能 量 函数 作为 描述 其 网 络 状态 的 函数 ， 其 能 
量 函数 定义 如 下 : 
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E=-Lwvwvj 
2 下 


将 Boltzmann 机 视 为 一 个 动力 系统 ， 则 网 络 温度 以 某 种 方式 下 降 到 一 个 特定 值 时 ， 系 
统 将 趋 于 一 个 稳定 平衡 态 ， 此 时 也 就 对 应 着 能 量 函 数 的 极 小 值 。 在 应 用 中 ， 将 需要 求解 的 
优化 问题 的 目标 函数 与 网 络 的 能 量 函数 相对 应 ， 就 能 够 通过 网 络 的 稳定 状态 找到 优化 目标 
的 极 小 值 。 

网 络 学 习 的 目的 是 通过 给 出 一 组 学 习 样 本 ， 经 学 习 后 得 到 Boltzmann 机 各 种 神经 元 之 
间 的 连接 权 值 w 。 

Boltzmann 机 采用 的 学 习 算法 为 模拟 退火 算法 ， 其 学 习 步 骤 可 归纳 如 下 。 

全 随机 设 定 网络 的 连接 权 值 w(0) 及 初始 高 温 。 

侠 按照 已 知 的 概率 P(xo) ， 依 次 给 定 学 习 样本 。 在 样本 的 约束 下 ， 按 照 模拟 退火 程 
度 运行 网 络 ， 直 至 达到 平衡 状态 ， 统 计 出 户 。 在 无 约束 条 件 下 ， 按 同样 的 步骤 和 同样 的 次 
数 运行 网 络 ， 统 计 出 方 '。 

国 按 下 述 公式 修改 权 值 


wii(k+D=wr(k)+7( 记 一 态 )7>0 


全 重复 上 述 步 又， 直到 及 - 羽 ' 小 于 一 定 的 容 限 。 

与 Hopfield 网 络 的 动力 学 演化 相 比较 ，Boltzmann 机 处 于 某 一 状态 的 概率 是 与 温度 了 
有 关 的 。 

(1 ) 网 络 温度 7 很 高 时 ， 各 状态 出 现 的 概率 差异 比较 小 ， 因 而 网 络 停留 在 全 局 极 小 点 
的 概率 并 不 比 停留 在 局 部 极 小 点 的 概率 高 很 多 。 在 另 一 方面 可 以 理解 为 ， 高 的 网 络 温度 可 
以 保证 ， 网 络 并 不 会 陷入 某 一 个 局 部 极 小 点 而 走 不 出 来 。 

(2 ) 网 络 温度 了 很 低 时 ， 各 状态 出 现 的 概率 差异 变 得 很 大 ， 因 而 网 络 一 旦 陷入 某 一 个 
局 部 极 小 点 后 ， 要 跳出 该 局 部 极 小 点 的 可 能 性 是 比较 小 的 。 但 是 ， 这 基本 上 能 够 保证 网 络 
到 达 全 局 极 小 点 时 ， 跳 出 的 可 能 性 小 。 

(3 ) 网 络 温度 7 一 0 时 ， 跳 出 局 部 极 小 点 的 概率 趋 于 无 穷 小 ， 这 也 保证 网 络 最 终 状态 
能 够 稳定 在 全 局 极 小 点 。 

在 Hopfield 网 络 中 ,每 一 种 约束 相当 于 一 种 初始 条 件 ， 不 同 的 约束 造成 不 同 的 初始 条 
件 可 能 使 网 络 陷入 不 同 的 局 部 极 小 点 。 而 相 比较 而 言 ，Boltzmann 机 则 采用 一 种 概率 式 的 
搜索 方式 ， 随 着 温度 的 降低 ， 网 络 所 处 状态 的 概率 集中 于 一 个 低能 量 状态 的 子 集 。 

由 于 要 进行 多 次 模拟 退火 过 程 ， 因 此 Boltzmann 机 的 学 习 计 算 量 大 ， 经 平均 场 近似 改 
善后 ， 速 度 可 以 提高 1 到 2 个 数量 级 ， 具 体 算法 这 里 不 再 叙述 。 


基于 遗传 算法 的 神经 网 络 优化 


遗传 算法 ( Genetic Algorithm，GA ) 是 一 种 基于 自然 选择 和 基因 遗传 学 原理 的 优化 搜 
索 方法 。 它 将 “优胜 劣 汰 ， 适 者 生存 ”的 生物 进化 原理 引入 待 优化 参数 形成 的 编码 串 群体 
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中 ,按照 一 定 的 适 配 值 函数 及 一 系列 遗传 操作 对 各 个 体 进 行 筛选 ， 从 而 使 适 配 值 高 的 个 体 
被 保留 下 来 , 组 成 新 的 群体 , 新 群体 中 各 个 体 适 应 度 不 断 提 高 , 直至 满足 一 定 的 极限 条 件 。 
此 时 ， 群 体 中 适 配 值 最 高 的 个 体 即 为 待 优化 参数 的 最 优 解 。 正 是 由 于 遗传 算法 独 有 的 工作 
原理 ， 使 它 能 够 在 复杂 空间 进行 全 局 优化 搜索 ， 并 且 具 有 较 强 的 鲁 棒 性 。 

遗传 算法 应 用 于 神经 网 络 的 一 个 方面 是 用 来 优化 神经 网 络 ( ANN ) 的 结构 ， 另 一 个 方 
面 是 用 来 学 习 ANN 的 权 值 ， 也 就 是 用 遗传 算法 取代 一 些 传统 的 学 习 算法 。 


14.3.1 ”遗传 算法 介绍 


遗传 算法 通过 模拟 自然 环境 中 的 遗传 和 进化 过 程 ， 从 而 形成 一 种 全 局 自 适应 优化 概率 
搜索 算法 。 
对 于 一 个 求 函数 极 大 值 的 优化 问题 ， 一 般 可 以 描述 为 下 述 数 学 规划 模型 ; 
max J(X) 
S4。、 是 E 慌 
REDU 


其 中 ， 天 = [mvxa,yxn] 为 决策 变量 ，J(X) 为 目标 函数 ， 第 2、3 式 为 约束 条 件 ， 忆 
是 基本 空间 ， 及 是 U 的 一 个 子 集 。 满 足 约束 条 件 的 解 万 称 为 可 行 解 ， 集 合 R 表示 由 所 有 
满足 约束 条 件 的 解 组 成 的 集合 ， 称 为 可 行 解 集合 。 

对 于 以 上 最 优化 问题 ， 目 标 函数 和 约束 条 件 种 类 繁多 ， 各 种 不 同 的 形式 对 应 的 解法 也 
大 不 相同 。 常 用 的 寻找 最 优 解 的 方法 有 3 种 ， 分 别 是 枚 举 法 、 启 发 式 算法 和 搜索 算法 。 

(1 ) 枚 举 法 : 枚 举 出 可 行 解 集合 内 的 所 有 可 行 解 ， 求 出 精确 最 优 解 。 这 种 方法 只 能 对 
有 限 的 可 行 解 集合 使 用 ， 并 且 效率 较 低 。 

( 2 ) 启发 式 算法 : 通过 寻求 一 种 能 产生 可 行 解 的 启发 性 规则 ， 从 而 找到 一 个 最 优 解 或 
者 近似 最 优 解 。 这 种 方法 对 不 同 的 问题 需要 找 出 其 特定 的 启发 式 规则 ， 应 用 时 也 有 一 定 的 
难度 。 

( 3 ) 搜索 算 法 : 寻求 一 种 搜索 算法 ， 此 算法 在 可 行 解 集合 的 一 个 子 集 内 进行 搜索 操作 ， 
已 找到 问题 的 最 优 或 近似 最 优 解 。 例 如 梯度 搜索 算法 , 这 种 方法 如 果 结合 一 些 启发 式 知识 ， 
常常 可 以 取得 一 种 好 的 平衡 。 

在 遗传 算法 中 ,将 ” 维 决策 向 量 大 = [az，,zm 世 用 半 个 记号 XiG=1l2…, 站 所 组 成 的 
符号 串 X 表示 : 





时 二 XXX 于 王 [站 于 


把 每 一 个 Xi 看 做 一 个 遗传 基因 ， 它 的 所 有 的 可 能 取 值 称 为 等 位 基因 。 这 样 改 就 可 看 
做 由 户 个 遗传 基因 组 成 的 一 个 染色 体 。 一 般 情况 下 ， 染 色 体 的 长 度 上 是 固定 的 ， 但 对 一 些 
问题 ，n 也 可 以 是 变化 的 。 根 据 不 同 的 情况 ， 这 里 的 等 位 基因 可 以 是 一 组 整数 ， 也 可 以 是 
某 一 范围 内 的 实数 值 ， 或 者 纯粹 的 一 个 记号 。 最 简单 的 等 位 基因 是 由 0 和 1 这 两 个 整数 
组 成 的 , 相应 的 染色 体 就 可 以 表示 为 一 个 二 进 制 符号 串 。 这 种 编码 形成 的 排列 形式 天 就 是 
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个 体 的 基因 型 ,与 之 对 应 的 大 值 就 是 个 体 的 表现 型 。 个 体 的 适应 度 与 其 对 应 的 个 体 表 现 型 
马 的 目标 函数 值 相 关联 ，X 越 接 近 于 目标 函数 的 最 优点 ， 其 适应 度 越 大 ， 反 之 ， 其 适应 
度 越 小 。 

遗传 算法 中 , 决策 变量 X 组 成 了 问题 的 解 空 间 。 对 问题 最 优 解 的 搜索 是 通过 对 染色 体 
X 的 搜索 过 程 来 进行 的 ， 从 而 所 有 的 染色 体 X 就 组 成 了 问题 的 搜索 空间 。 遗 传 算法 的 运 
算 过 程 也 是 一 个 反复 迭代 过 程 ， 第 4 代 群 体 记 做 P(D， 经 过 一 代 遗 传 和 进化 后 ， 得 到 第 
t+ 1 代 群 体 ， 它 们 也 是 由 多 个 个 体 组 成 的 集合 ， 记 做 Pt+ D。 

遗传 算法 中 最 优 解 的 搜索 过 程 也 是 模仿 生物 的 进化 过 程 ， 通 过 染色 体 之 间 的 交叉 和 变 
异 来 完成 。 通 过 所 谓 的 遗传 算 子 ( Genetic Operators ) 作用 于 群体 Pt) 中 ， 进 行 遗 传 操作 ， 
从 而 得 到 新 一 代 群 体 Pt+ D。 

({ 1) 选择 ( Selection )。 根据 个 体 的 适应 度 , 按照 一 定 的 规则 或 方法 ,从 第 ! 代 群 体 PoD) 
中 选择 出 一 些 优良 的 个 体 遗 传 到 下 一 代 群 体 Pt+ D 中 。 

(2 ) 交叉 ( Crossover )。 将 群体 PLD) 内 的 个 体 随机 搭配 成 对 ， 对 每 一 对 个 体 ， 以 某 个 概 
率 ( 称 为 交叉 概率 ，crossover rate ) 交换 他 们 之 间 的 染色 体 。 

( 3 ) 变异 ( Mutation )。 对 群体 Pb) 中 的 每 一 个 个 体 ， 以 某 一 概率 ( 称 为 变异 概率 ，Mutation 
Rate ) 将 某 一 个 或 某 一 些 基 因 座 上 的 基因 值 改 为 其 他 的 等 位 基因 。 

遗传 算法 的 运算 过 程 如 图 14-10 所 示 。 


Ge 一 一 一 一 














交叉 运算 个 体 评价 

















Ce 一 加 可 -Ce) 
图 14-10 ”遗传 算法 流程 


由 图 中 可 以 看 出 ， 使 用 上 述 三 种 遗传 算 子 ( 选择 算 子 、 交 叉 算 子 和 变异 算 子 ) 的 遗传 
算法 的 主要 运算 过 程 如 下 所 述 。 

全 初始化。 设置 进化 代数 计数 器 *=0， 设置 最 大 进化 代数 7; 随机 生成 M 个 个 体 作 
为 初始 群体 P(O)。 

命 个 体 评价 。 计 算 群 体 P(D 中 个 体 的 适应 度 。 

登 选择 运算 。 将 选择 算 子 作用 于 群体 。 

合 交叉 运算 。 将 交叉 算 子 作用 于 群体 。 





本 本 本 本 319 


精通 MATLAB 神经 网 络 


侠 变异 运算 。 将 变异 算 子 作用 于 群体 。 群 体 P(D 经 过 选择 、 交 叉 、 变 异 运算 之 后 得 
到 下 一 代 群 体 Pt+ Do 

癸 终止 条 件 判断 。 若 IT， 则 : += 寺 1， 转 到 步骤 全 ; 若 >T， 则 以 进化 过 程 中 得 到 
的 具有 最 大 适应 度 的 个 体 作为 最 优 解 输出 ， 终 止 计算 。 

相对 于 其 他 各 种 优化 算法 ， 如 单纯 形 法 、 梯 度 法 、 动 态 规划 法 、 分 支 定 界 法 等 ， 遗 传 
算法 是 一 类 可 用 于 复杂 系统 优化 计算 的 稳健 的 搜索 算法 ， 其 特点 如 下 。 

( 1 ) 以 决策 变量 的 编码 作为 运算 对 象 。 

(2 ) 直接 以 目标 函数 值 作为 搜索 信息 。 





(4 ) 使 用 概率 搜索 技术 。 


14.3.2 ”基于 遗传 算法 的 神经 网 络 优化 算法 


设 有 三 层 BP 网 络 , /为 输入 层 中 第 [个 结 点 的 输出 ; 态 为 隐 含 层 中 第 i 个 结 点 的 输出 ; 
O, 为 输出 层 中 第 i 个 结 点 的 输出 ; WIHy 为 输入 层 中 第 i 个 结 点 与 隐 含 层 第 个 结 点 的 连接 
权 值 ， WHO) 为 隐 含 层 中 第 个 结 点 与 输出 层 第 i 个 结 点 的 连接 权 值 。 遗 传 算法 学 习 BP 网 
络 的 步骤 如 下 。 

合 初始 化 种 群 P， 包 括 交叉 规模 、 交 叉 概率 Pec、 突 变 概率 Pm 以 及 对 任 一 WIHy 和 
WHO 初始 化 ; 在 编码 中 ， 采 用 实数 进行 编码 ， 初 始 种 群 取 值 为 30。 

全 计算 每 一 个 个 体 评价 函数 ， 并 将 其 排序 。 可 按 下 式 概率 值 选择 网 络 个 体 ， 


汪 冰 
六 
其 中 矿 为 个 体 站 的 适 配 值 ， 可 用 误差 平方 和 已 来 衡量 ， 即 


< 
J0O=ED 


ED= 忆 > -TD 
FE 


其 中 汪 1，…… ，N， 表 示 染 色 体 数 ;， 好 1，…… ，4 为 输出 层 节点 数 ，P=1，…… ， 5 
为 学 习 样 本 数 ， 人 为 教师 信号 。 

侠 以 概率 Pc 对 个 体 G; 和 Gh 交叉 操作 产生 新 个 体 Gi' 和 Gixi"， 没 有 进行 交叉 操作 
的 个 体 直接 进行 复制 。 

合 利用 概率 Pm 突变 产生 G) 的 新 个 体 Gj 。 

合 将 新 个 体 插入 到 种 群 P 中 ， 并 计算 新 个 体 的 评价 函数 。 

全 如 果 找到 了 满意 的 个 体 ， 则 结束 ， 否 则 转 至 步骤 合 。 达 到 所 要 求 的 性 能 指标 后 ， 
将 最 终 群体 中 的 最 优 个 体 解码 即 可 得 到 优化 后 的 网 络 连接 权 值 。 
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理论 分 析 和 实验 结果 表明 ， 遗 传 算法 作为 一 种 新 型 的 全 局 优化 搜索 算法 ， 将 它 用 于 神 
经 网 络 权 值 的 训练 学 习 能 得 到 较 好 的 结果 ， 它 能 克服 BP 算法 中 学 习 效率 低 、 收敛 速度 慢 、 
容易 陷入 局 部 最 优等 缺点 ， 是 神经 网 络 权 值 训 练 学 习 的 有 效 方法 。 

遗传 算法 适合 于 处 理 规模 较 大 的 并 行 问题 ， 因 此 ， 当 网 络 的 结构 较 庞大 时 ， 只 要 选择 
了 合适 的 控制 参数 ， 就 能 够 更 充分 地 发 挥 出 其 收 伍 速度 快 ， 不 至 于 陷入 局 部 最 小 的 优点 


14.3.3 ”遗传 算法 优化 实例 


遗传 算法 是 人 工 智能 算法 中 比较 具有 代表 性 的 一 种 算法 ， 本 节 对 遗传 算法 应 用 进行 介 
绍 。 神 经 网 络 工具 箱 中 没有 有 关 遗 传 算法 的 内 容 ， 运行 本 节 中 的 实例 需要 安装 本 书 附带 光 
盘 中 的 GAOT 工具 箱 ， 此 工具 箱 为 第 三 方 开放 工具 箱 。 

GAOT 工具 箱 的 安装 过 程 同 SVM-KM 工具 箱 类 似 ， 执 行 步骤 如 下 。 

人 鲜 将 gaot 工 具 箱 压缩 包 解压 到 期 望 的 文件 夹 ， 最 好 选择 MATLAB 安装 目录 下 的 
toolbox 文件 夹 。 

@@ 在 MATLAB 命令 窗口 中 选择 “File” 菜单 下 的 “Set Path” 选项 。 

侠 单 击 "Add with Subfolders"， 在 其 中 选择 解压 缩 后 的 _gaot 文件 夹 ， 将 其 添加 到 
MATLAB 配置 目录 中 。 

合 单 击 “Save"” 按钮 保存 配置 ， 再 单 击 “Close” 按钮 ， 即 完成 此 工具 箱 的 安装 。 

此 工具 箱 中 主要 的 函数 包括 initializega 函数 和 ga 函数 ， 其 中 ga 函数 是 遗传 算法 的 应 
用 函数 。 其 调用 格式 为 ， 


[x，endPop]=ga(bounds，evalFN，evalops，starLtPop，opts， +ermFN，termops， 
selectFN，selectOps，xOverFNs，xOverOps，mutFNs，mutops) 


其 中 ， 函 数 的 输出 参数 如 下 : 

。 x 为 遗传 运算 过 程 中 得 到 的 最 优 解 ; 

。 endPop 为 遗传 运算 得 到 的 最 终 种 群 。 

输入 参数 如 下 

。 bounds 为 变量 取 值 范围 ; 

。evalFN 为 定义 优化 函数 的 M 文件 名 称 ; 

。 evalOps 为 传递 给 优化 函数 的 参数 ， 通 常 为 空 ; 

。 startPop 为 初始 种 群 ; 

。 opts 为 一 个 向 量 [epsilon ”prob_ops display]， 其 中 epsilon 为 求解 精度 ，prob_ops 
为 0 或 1， 决定 遗 传 算法 是 否 采用 概率 搜索 方式 ，display 确定 是 否 显示 ; 

。 termFN 为 终止 函数 ， 通 常设 置 为 [maxGenTerm']; 

。termOps 为 传递 给 termFN 的 参数 ， 为 算法 执行 的 次 数 ， 

。 selectFN 为 选择 函数 ， 通 常 为 [nornGeomSelect]; 

。 selectOpts 为 传递 给 selectFN 的 参数 ， 通 常 为 [0.08]; 

。 xOverFNS 为 交叉 函数 ， 通 常 可 选 [arithXover heuristicXover simpleXover] 之 一 ; 
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exOverOps 为 传递 给 交叉 函数 的 参数 ， 根 据 交 叉 函数 的 不 同 ， 通 常 对 应 [2 0;2 3;2 0] 
e mutFNS 为 变异 函数 ， 通 常 可 选 [boundaryMutation multiNonUnifMutation 
nonUnifMutation unifMutation'] 之 一 ; 
e mutOps 为 传递 给 变异 函数 的 参数 向 量 ， 第 一 个 元 素 为 交叉 变异 个 数 ， 第 二 个 元 素 
则 为 算法 执行 次 数 。 
工具 箱 安装 完 毕 之 后 ， 就 可 以 进入 下 面 的 实例 操作 。 
【 例 14-3】 遗传 算法 优化 实例 。 给 定 一 维 函数 : KoO=x+10sin(5z)+7cos(40)， 应 用 遗 
传 算法 对 此 函数 在 [0,9] 取 值 区 间 内 进行 最 大 值 搜索 。 
解 ，@@ 清空 数据 空间 。 在 MATLAB 命令 空间 中 输入 命令 : 





close al1 

clec 

接 下 来 绘制 函数 图 形 ， 并 锁定 画面 。 输 入 命令 : 
fplot('x + 10*sin(5*x)+7*cos(4*x) [0 9]) 
hola on 


绘 出 函数 曲线 如 图 14-11 所 示 。 











人 
图 14-11 ”曲线 图 形 窗口 

人 初始 化 遗传 算法 。 输 入 命令 

initpop=initializega(20,[0 9j，'gademolevall')7 

此 处 ，initializega 函数 为 遗传 算法 的 初始 化 函数 ， 其 调用 格式 如 下 : 

[pop] = inicializega(num，bounds，evalFN) 


initializega 函数 执行 的 结果 是 返回 一 个 随机 初始 点 及 其 函数 值 构 成 的 二 维 矩阵 pop 作 
为 遗传 的 初始 种 群 。 其 中 ， 初 始点 个 数 为 num， 此 处 设 定 初始 点 个 数 为 20; 取 值 范围 由 
bounds 确定 ， 此 处 定 为 [0.91，evalFN 为 初始 化 函数 ， 通 常 由 M 函数 文件 定义 ， 这 里 的 初 
始 化 函数 定义 在 gademolevall.m 文件 中 。 
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我 们 可 以 查看 gademoevall.m 文件 中 的 函数 定义 。 输 入 命令 


Clc 
type gademoleval1 


从 输出 的 内 容 中 可 以 看 到 ， 此 M 文件 中 定义 的 函数 正 是 : 
工 (X) =x+l10sin (5xJ)+7cos(4x) 


下 面 对 initializega 函数 生成 的 初始 点 进行 绘图 显示 ， 在 原 函 数 曲线 上 绘 出 初始 点 ， 以 
加 号 “+” 表 示 。 输 入 命令 


plot (initPop(:,1) ,inicPop(:,2)，+') 





Pausei 

给 出 图 形 如 图 14-12 所 示 。 
芭 
a 








人 


图 14-12 ”遗传 算法 的 初始 种 群 点 


全 调用 ga 函数 进行 遗传 运算 ， 首 先进 行 1 次 遗传 、 交 叉 和 变异 ， 并 查看 算法 执行 的 
效果 。 输 入 命令 : 


[x endpop] = ga([0 9]j，..- 

"gademoleval1l',[],initPpop, [le-6 1 1],，'maxGenTerm',1,... 
'normGeomSelect', [0.08],['arithXxover'], [2 0],'nonUnifMutation',[2 1 3])， 
2 





对 结果 进行 绘图 显示 ， 在 原 函数 曲线 上 绘 出 1 次 遗传 运算 后 的 取 值 点 ， 以 空心 加 力 表 
示 。 输 入 命令 ， 

Plot (enqPop(:,1),endPop(:,2)，'ro') 

pauae 


绘 出 图 形 如 图 14-13 所 示 。 可 见 经 过 1 次 遗传 、 交 叉 、 变 异 运算 之 后 ， 种 群 位 置 在 函 
数 曲 线 上 发 生 了 移动 。 

合 调用 遗传 算法 ， 进 行 50 次 遗传 运算 。 输 入 命 

[x endPop] = ga([0 9],-.- 

'gademoleval1',[],initpop, [le-6 1 1],'maxGenTerm',50,，... 
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rnormGeomSelect', [0.08],['arithXover'], [2],'nonUnifMutation',[2 50 3])7 
2 
中 
1 过 
全 | j 


[ET 


图 14-13 ”一 次 遗传 运算 后 的 种 群 点 
在 原 函数 曲线 上 绘 出 50 次 遗传 运算 后 所 取 的 点 以 星 号 “* ”表示 。 输 入 命令 ， 


plot (endPop(:,1),endPop(:,2)，b* ) 














hold off 
绘 出 图 形 如 图 14-14 所 示 。 
节 





由 WA 上 


OO 





图 14-14 ”50 次 遗传 运算 后 的 种 群 点 


从 图 中 可 以 看 到 ， 最 终 种 群 确实 收敛 到 了 函数 的 最 大 值 点 。 
对 最 优 解 进行 查看 ， 输 入 命令 : 


x = 7.8567 24.8554 

此 即 和 遗传 运算 寻 得 的 最 优 解 ， 对 应 取 值 区 间 内 优化 函数 的 最 大 值 。 

上 面 通 过 gaot 工具 箱 介绍 了 和 遗传 算法 应 用 于 函数 优化 的 基本 过 程 ， 应 用 遗传 算法 对 神经 
网 络 进行 优化 是 神经 网 络 技术 中 一 个 很 有 前 景 的 发 展 方向 ， 更 多 的 实例 可 以 参考 其 他 资料 。 
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PP 小 舍 


神经 网 络 和 人 工 智 能 技术 发 展 了 数 十 年 ， 目 前 所 包含 的 内 容 已 经 非常 丰富 ， 本 章 所 述 
的 神经 网 络 优化 方法 就 是 一 些 比较 有 前 景 和 应 用 价值 的 方法 ,不 过 在 目前 版 本 的 MATLAB 
神经 网 络 工具 箱 中 没有 对 应 的 函数 。 本 章 的 目的 主要 在 于 提出 这 些 方法 ， 因 此 不 展开 细致 
的 分 析 ， 有 兴趣 的 读者 可 以 参考 详细 论述 的 书籍 ， 做 进一步 的 深入 学 习 。 
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自动 控制 理论 已 有 50 年 的 历史 了 。 按 照常 规 分 类 ， 自 动 控制 分 为 两 个 分 支 ， 连 续 控 
制 和 离散 控制 。 在 连续 控制 中 信号 是 时 变 的 ， 并 且 由 过 去 的 模拟 量 闭环 控制 转 为 由 计算 机 
实施 的 数字 控制 。 离 散 控制 系统 很 大 程度 上 已 经 趋 于 继 电 开关 式 控制 { 可 编程 控制 器 
PLC )， 系 统 实质 上 是 在 进行 启动 、 停 止 、 等 待 或 监测 一 系列 的 离散 事件 。 

尽管 自动 控制 技术 已 经 成 功 地 在 工业 中 得 到 了 应 用 ,并 实现 了 降低 产品 费用 、 确 保 
生产 过 程 可 靠 性 的 目标 ， 但 是 ， 大 部 分 自动 控制 仍然 局 限 在 较 小 的 内 ， 局 限于 对 
某 一 个 或 几 个 物理 参量 的 控制 。 自 动 控制 的 目标 是 实现 全 方位 的 系统 或 过 程 的 最 优 调 
节 ， 这 不 仅 包括 机 器 本 身 ， 还 应 考虑 人 的 行为 ， 首 先 要 做 的 工作 就 是 对 系统 进行 准确 
的 建 模 。 然 而 ， 要 建立 一 个 完整 的 复杂 系统 的 模型 是 很 困难 的 ， 并 且 在 很 多 情况 下 也 
不 必要 。 

在 自动 控制 的 过 程 中 ， 总 代价 成 本 ( 包括 资源 、 能 量 、 工 作 量 等 ) 也 是 一 个 非常 关键 
的 量 。 我 们 对 系统 的 控制 ， 总 是 需要 对 整个 过 程 所 有 参量 进行 集中 控制 。 然 而 ， 在 集中 控 
制 这 些 参量 时 ， 往 往 会 遇 到 环 手 的 问题 ， 其 中 的 问题 包括 








1. 固有 的 不 稳定 性 


系统 或 者 整个 过 程 可 能 是 动态 不 稳定 的 。 在 这 样 的 系统 中 ， 不 改变 控制 的 状态 可 能 会 
导致 系统 性 能 的 恶化 。 


2， 数据 不 完整 或 过 多 


大 量 观测 数据 可 能 有 噪声 ， 是 不 可 信 的 ， 另 一 方面 ， 数 据 也 可 能 太 多 以 致 存在 宛 余 
我 们 必须 筛选 出 有 用 的 数据 。 
3. 不 可 扒 识 的 过 程 

仍然 存在 一 些 不 可 辨识 的 过 程 ， 这 给 控制 造成 了 困难 。 

传统 的 控制 理论 建立 在 数学 模型 的 基础 上 ， 甚 至 我 们 认为 ， 必 须 找到 系统 的 线性 化 模 
型 才能 够 实现 合理 的 控制 。 因 为 我 们 对 非 线 性 和 时 变 系统 ， 并 没有 很 好 的 统一 处 理 方法 。 
这 是 制约 自动 控制 的 一 个 瓶颈 问题 

然而 ， 随 着 计算 机 的 快速 发 展 ， 不 基于 数学 模型 的 控制 也 快速 发 展 起 来 。 比 如 将 人 工 
智能 、 计 算 机 技术 与 自动 控制 结合 起 来 ， 通 过 人 工 神经 网 络 的 自学 习 、 自 组 织 、 容 错 性 和 
并 行 性 来 实现 系统 控制 ， 能 够 更 好 地 处 理 系统 的 非 线性 特性 ， 并 进行 多 变量 并 行 分 布 式 处 
理 ， 是 非常 具有 优势 的 。 
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神经 网 络 控制 概述 


神经 网 络 在 控制 系统 中 的 应 用 从 20 世纪 60 年 代 就 已 经 开始 了 ， 最 早 的 工作 是 由 
Widrow 和 Hoff 做 出 的 。20 世纪 80 年 代 以 后 ， 随 着 计算 机 与 人 工 智能 热潮 的 兴起 ， 
Neurocontrol 这 个 新 名 词 即 应 运 而 生 了 。 

神经 网 络 相对 于 传统 控制 手段 ， 具 有 以 下 优势 。 

(1 ) 非 线性 特性 。 神 经 网 络 能 够 以 任意 精度 实现 非 线性 映射 ， 从 而 可 以 适用 于 复杂 的 
系统 建 模 。 

( 2 ) 并 行 分 布 式 处 理 。 神 经 网 络 具有 并 行 结构 ， 可 以 进行 并 行 数据 处 理 ， 同 时 具有 更 
强 的 容错 能 力 。 

(3 ) 学 习 与 自 适应 能 力 。 神 经 网 络 是 一 种 时 间 序 列 处 理 的 方法 ， 应 用 过 去 的 数据 记录 
进行 训练 ， 因 此 便于 进行 在 线 自 适 应 调节 。 

(4) 多 变量 系统 。 神 经 网 络 可 以 处 理 多 个 输入 信号 ， 可 以 适用 于 多 变量 系统 。 

从 目前 来 看 ， 神 经 网 络 在 非 线性 系统 中 的 应 用 是 非常 重要 的 ， 因 为 目前 并 没有 一 个 普 
遍 可 适用 的 理论 来 指导 非 线性 系统 的 设计 ; 而 利用 神经 网 络 提供 非 线性 系统 的 模型 ， 基 于 
理论 方法 和 优化 技术 设计 非 线性 控制 器 ， 则 是 一 个 比较 有 前 途 的 方向 。 另 一 方面 ， 神 经 网 
络 可 以 应 用 于 动态 变化 的 系统 ， 与 控制 理论 中 的 自 适 应 系统 具有 一 定 相似 性 。 


15.1.1 监督 式 神经 网 络 控制 


对 于 受 控 系统 的 动态 特性 是 未 知 或 仅 有 部 分 是 已 知 的 情况 ， 需 要 寻找 一 种 支配 系统 行 
为 的 规律 ， 以 便 系统 能 够 被 有 效 地 控制 。 有 些 情况 下 ， 可 能 需要 设计 一 种 模仿 人 类 作用 的 
自动 控制 器 ， 基 于 规则 的 专家 控制 和 模糊 控制 是 一 种 方法 ， 而 神经 网 络 控制 是 另 一 种 可 选 
的 方法 ， 也 称 为 监督 式 神经 控制 。 监 督 式 神经 网 络 控制 系统 的 结构 如 图 15-1 所 示 。 





















CD 


-| 
7 ee 
图 15-1 监督 式 神经 网 络 控制 系统 的 结构 


图 15-1 所 示 的 监督 式 神经 网 络 控制 系统 包括 以 下 几 个 组 成 模块 : 监督 程序 、NNC ( 可 

训练 的 神经 网 络 控制 器 人 受 控 对 象 。 其 中 ，NNC 的 输入 就 是 由 人 接收 的 传 感 输入 信息 ， 

而 输出 则 应 用 于 对 系统 的 控制 。 监 督 式 神经 网 络 控制 系统 实现 控制 具有 以 下 几 个 步骤 。 
全 通过 传感器 和 传 感 信息 处 理 ， 调 用 必要 的 和 有 用 的 控制 信息 。 
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侠 选择 神经 网 络 类 型 、 结 构 参数 和 学 习 算法 等 等 ， 构 造 神经 网 络 。 

合 训练 神经 网 络 控制 器 ， 实 现 输入 与 输出 间 的 映射 ， 从 而 进行 正确 的 控制 。 训 练 
过 程 可 采用 线性 律 、 反 馈线 性 化 或 解 三 变换 的 非 线性 反馈 作为 监督 程序 ， 对 网 络 进行 
训练 。 





15.1.2 ”直接 逆 模 型 神经 网 络 控制 


所 谓 的 直接 逆 模 型 神经 网 络 是 指 将 受 控 系统 的 一 个 逆 模型 与 受 控 系统 串联 ， 从 而 使 系 
统 在 期 望 响应 与 受 控 系统 输出 之 间 得 到 一 个 相同 的 映射 。 此 网 络 直接 作为 前 馈 控 制 器 ， 并 
且 受 控 系统 的 输出 等 于 期 望 输出 ， 此 控制 方案 已 经 用 于 机 器 人 控制 。 这 种 方法 进行 控制 的 
效果 很 大 程度 上 依赖 于 作为 控制 器 的 逆 模 型 的 精确 程度 。 由 于 缺少 反馈 ， 所 以 这 种 方法 的 
健壮 性 不 够 。 不 过 ， 通 过 调整 学 习 参 数 ， 这 种 方法 的 健壮 性 是 可 以 提高 的 。 

一 种 直接 逆 模型 神经 网 络 控制 系统 的 结构 如 图 15-2 所 示 。 





图 15-2 直接 逆 模型 神经 网 络 控制 系统 的 结构 


15.1.3 ”神经 网 络 自 适应 控制 


神经 网 络 自 适应 控制 与 常规 自 适应 控制 是 类 似 的 ， 可 以 分 为 两 类 ， 分 别 是 神经 网 络 自 
校正 控制 ( STC ) 和 模型 参考 自 适应 控制 ( MRAC )。 这 两 类 控制 系统 之 间 存 在 一 定 的 差别 
自 校正 控制 系统 是 根据 受 控 系统 的 正 或 负 逆 模型 辩 识 结果 来 对 常规 控制 器 的 内 部 参数 进 
行 调节 ， 从 而 满足 系统 给 定 的 性 能 指标 ， 而 在 模型 参考 自 适应 控制 系统 中 ， 闭 环 控制 系统 
的 期 望 性 能 由 一 个 稳定 的 参考 模型 给 出 ， 控 制 系统 的 目标 是 使 得 受 控 系统 的 输入 y(0 与 参 
考 模型 的 输出 y (0 近似 匹配 。 

下 面 分 别 对 其 进行 说 明 。 


1 神经 网 络 自 校 正 控制 


神经 网 络 自 校正 控制 又 分 为 两 种 类 型 ， 分 别 是 直接 自 校正 控制 和 间接 自 校正 控制 。 其 
中 ， 直 接 自 校正 控制 系统 由 一 个 常规 控制 器 与 一 个 识别 器 组 成 ， 后 者 具有 很 高 的 建 模 精 度 
和 识别 能 力 ， 结 构 上 与 直接 逆 模 型 控制 系统 类 似 。 间 接 自 校正 控制 系统 的 结构 如 图 15-3 
所 示 。 
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图 15-3 ”神经 网 络 间接 自 校正 控制 系统 的 结构 


15-3 中 的 控制 系统 由 一 个 常规 控制 器 与 一 个 神经 网 络 辨识 器 构成 , 能 实现 对 受 控 装 
置 的 控制 。 受 控 对 象 可 以 以 一 个 单 变 量 非 线性 系统 模型 来 表征 : 


Jrl= (ye)+8(COyD)Dy 
其 中 ，J(yw) 与 8(y) 均 为 非 线性 函数 。 ye 为 系统 在 寻 1 时 刻 的 输出 。 


2， 神经 网 络 模型 参考 自 适应 控制 
神经 网 络 模型 参考 自 适应 系统 的 组 成 结构 如 图 15-4 所 示 。 

















图 15-4 ”神经 网 络 模型 参考 自 适应 控制 系统 的 结构 
如 图 15-4 所 示 ， 系 统 控制 的 目标 是 维持 受 控 对 象 输出 与 参考 模型 输出 之 间 的 差 , 
ec(D=yOD 一 (CD 
由 于 在 反 向 传播 控制 中 需要 知道 受 控 系统 的 数学 模型 ， 因 此 这 种 控制 系统 的 学 习 和 修 
正 还 存在 一 些 问题 。 
15.1.4 ”神经 网 络 内 模 控制 


在 常规 内 模 控制 系统 中 ， 通 常 是 采用 受 控 系 统 的 正 逆 模型 作为 反馈 回路 中 的 单元 ， 这 
种 控制 方式 经 过 了 比较 全 面 的 检测 ， 其 不 仅 可 以 用 于 健壮 性 和 稳定 性 分 析 ， 而 且 是 一 种 新 
的 重要 的 非 线性 系统 控制 方法 。 其 结构 如 图 15-5 所 示 。 

图 15-5 所 示 系 统 由 滤波 器 、 逆 模型 神经 网 络 控制 器 NN1、 系 统 模型 NN2， 以 及 受 控 
装置 构成 。 其 中 系统 模型 NN2 是 基于 神经 网 络 的 一 个 具有 系统 特性 的 正 向 模型 ， 它 是 与 
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受 控 装 置 并 行 设置 的 ， 而 反馈 系统 由 系统 输出 与 系统 模型 输出 之 间 的 差 得 到 ， 并 且 在 控制 
器 NN1 中 进行 处 理 ， 此 控制 器 是 根据 系统 的 逆 模 型 给 出 的 。 滤 波 器 在 系统 中 的 用 途 是 使 
系统 满足 必要 的 健壮 性 ， 同 时 实现 闭环 系统 跟踪 响应 。 








可 
也 -On am | AN 《| 受 近 站 时 多 























图 15-5 ”神经 网 络 内 模 控制 系统 的 结构 


15.1.5 “神经 网 络 预测 控制 


预测 控制 是 基于 模型 的 一 类 控制 ， 产 生 于 20 世纪 70 年 代 ， 其 特点 是 具有 预测 模型 、 
滚动 优化 以 及 反馈 校正 等 处 理 过 程 。 经 证 明 ， 这 种 控制 方法 对 于 非 线 性 系统 能 够 产生 比较 
符合 期 望 的 稳定 性 。 一 种 神经 网 络 预测 控制 系统 的 结构 如 图 15-6 所 示 。 























图 15-6 ”神经 网 络 预测 控制 系统 的 结构 


图 15-6 所 示 ， 系 统 包含 神经 网 络 预测 器 NNP、 非 线性 优化 器 NLO、 受 控 装 置 、 滤 波 器 
4 个 组 成 部 分 。 其 中 NNP 用 来 预测 受 控 对 象 在 一 定 范围 内 的 未 来 响应 ， 其 公式 可 以 写 为 ; 


yG+J1D,= Ni NI +L Na2 


其 中 ，N ，Na 分 别 是 输出 预测 的 最 小 和 最 大 级 别 。 
如 果 在 ( ttj ) 时 刻 系统 的 预测 误差 定义 为 : 


ed+ 帮 =rd+ 帮 -yyG+JID 


则 非 线性 优化 器 NLO 将 选择 信号 xD)， 以 便 使 得 系统 的 二 次 性 能 判决 函数 了 达到 最 小 : 


Ni: AN 
J= 袜 ed+ 六 + 和 HAzd+7-D 
J=N 


| 
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其 中 ， Au(+7-D=xt+7-D-ud+72) 


15.1.6 ”神经 网 络 自 适 应 判断 控制 


神经 网 络 自 适应 判断 模型 是 由 Barto 等 人 提出 ， 并 由 anderson 等 人 发 展 的。 这 种 方法 
应 用 强化 学 习 原 理 ， 可 以 在 缺少 受 控 对 象 的 期 望 输入 的 情况 下 ， 尤其 是 在 系统 模型 未 知 或 
者 部 分 未 知 而 无 法 提供 期 望 输入 的 情况 下 ， 实现 对 系统 的 控制 。 

这 种 控制 系统 包括 两 个 网 络 : 一 个 是 自 适 应 判断 网 络 AJN,， 另 一 个 是 控制 选择 网 络 
CSN。 其 结构 如 图 15-7 所 示 。 





xD 





CD 








AD) 





图 15-7 ”神经 网 络 自 适应 控制 系统 的 结构 


其 中 ， 自 适应 判断 网 络 AJN 相当 于 强化 学 习 需 要 的 “导师 "。 它 有 两 个 作用 : 一 是 通 
过 不 断 的 赏罚 与 强化 学 习 ,使 AJN 成 为 一 个 数量 的 导师 ; 二 是 通过 学 习 ， 根 据 受 控 系 统 的 
当前 和 外 部 强化 反馈 信号 r(D)， 产 生 一 个 强化 信号 ， 提 供 内 部 强化 信号 ， 从 而 判断 当前 控 
制作 用 的 效果 。 

控制 选择 网 络 CSN 是 一 个 多 层 前 饿 神经 网 络 控制 器 ， 它 在 内 部 强化 信号 的 引导 下 进 
行 学 习 ， 经 过 学 习 之 后 的 CSN 网 络 ， 应 该 能 够 根据 当前 系统 编码 的 状态 ， 选择 给 出 下 一 
个 控制 信号 。 


15.1.7 ”多 层 神经 网 络 控制 


多 层 神经 网 络 控制 器 的 结构 如 图 15-8 所 示 ， 它 包含 前 饥 控 制 器 、 常 规 控 制 、 受 控 装置 
3 个 部 分 。 此 系统 的 前 饥 控 制 部 分 是 由 神经 网 络 实现 的 ， 其 训练 目标 在 于 使 期 望 输出 与 实 
际 装置 的 输出 之 间 的 偏差 达到 最 小 ， 而 该 误差 作为 反馈 控制 器 的 输入 。 在 此 过 程 中 ， 反 馈 
作用 与 前 馈 作 用 是 分 别 考虑 的 。 

在 此 情况 下 ,多 层 神经 网 络 控制 器 又 分 为 间接 结构 、 专 用 结构 、 通用 结构 等 结构 形式 ， 
这 里 不 再 歼 述 。 


攻 可 可 本 331 


靖 通 MATLAB8 神经 网 络 


前 馈 控制 器 
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15.1.8 “分 级 神经 网 络 控制 


分 级 神经 网 络 控制 系统 的 结构 如 图 15-9 所 示 ， 包 括 4 个 组 成 部 分 : 神经 网 络 直 神经 
网 络 TI、 常 规 控制 器 ， 以 及 受 控 装置 。 其 中 ，d 为 受 控 装置 的 期 望 输出 ， 它 作为 输入 传递 
给 神经 网 络 [、 神 经 网 络 贡 以 及 常规 控制 器 ，v(D) 为 受 控 装 置 的 控制 输入 ， y(D 为 受 控 装置 
的 实际 输出 。u#(b) 是 由 神经 网 络 IL 的 输出 ， 而 y*(D) 则 是 神经 网 络 I 的 输出 。 

此 控制 系统 可 看 做 由 三 部 分 构成 。 

第 一 部 分 是 一 个 常规 外 反馈 回路 。 反 馈 控制 是 以 期 望 装置 输出 4 和 由 传感器 测量 的 实 
际 装置 输出 0) 之 间 的 误差 e() 为 基础 的 。 通 常 ， 常规 控制 器 为 一 个 比例 微分 控制 器 。 

第 二 部 分 是 神经 网 络 I 通 道 部 分 。 它 可 以 构成 一 个 受 控 对 象 的 动力 学 内 模型 ， 用 于 监 
控 受 控 装置 的 输入 xD 和 输出 yb), 并 且 学 习 受 控 对 象 的 动力 学 特性 。 当 接收 到 一 个 受 控 装 
置 输入 wD) 时 ， 通 过 与 实际 系统 输出 XD 进 行 比较 ， 神经 网 络 I 计 算出 一 个 受 控 装置 近似 输 
出 *#(D。 从 这 个 意义 上 看 ， 这 部 分 起 到 的 是 一 个 系统 动态 特性 辨识 器 的 作用 。 

第 三 部 分 是 神经 网 络 I 通道 部 分 。 它 通过 系统 期 望 输出 4 与 受 控 装置 输入 xD， 计算 
得 到 一 个 合适 的 受 控 装 置 输入 分 量 ex(D)。 

















图 15-9 分 级 神经 网 络 控制 结构 
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在 此 控制 系统 的 学 习 阶段 ， 神 经 网 络 I 学 习 系统 的 动力 学 特性 ， 而 神经 网 络 开 学 习 系 
统 的 逆 动 力学 特性 。 随 着 学 习 进 行 ， 内 反馈 逐渐 替代 外 反馈 的 作用 ， 成 为 主 控制 器 。 然 后 
当 学 习 进一步 进行 时 ， 逆 动力 学 部 分 将 取代 内 反馈 控制 。 最 后 ， 此 装置 主要 由 前 侯 控 制 器 
进行 控制 ， 因 为 装置 的 输出 误差 与 内 反馈 一 起 几乎 不 复 存在 ， 因 此 可 以 提供 处 理 随机 扰动 
的 快速 控制 。 系 统 控制 的 最 后 效果 与 前 馈 控 制 效果 是 接近 的 。 

实际 上 ， 完 全 可 以 将 分 级 神经 网 络 划分 为 两 个 系统 : 基于 正 向 动力 学 器 辨识 器 的 系统 
和 基于 逆向 动力 学 辨识 器 的 系统 ， 单 独 进行 应 用 。 

前 面 介绍 了 各 种 类 型 的 神经 网 络 控制 系统 。 可 以 看 到 ， 由 于 神经 网 络 具 有 全 局 和 逼近 的 
能 力 ， 因 此 在 非 线性 系统 建 模 和 常规 非 线性 控制 器 得 到 了 很 好 的 应 用 。 

下 面 的 几 节 将 会 介绍 三 种 神经 网 络 控制 系统 的 应 用 实例 ,同时 每 一 节 都 有 对 其 基本 控 
制 原理 的 描述 ， 并 有 实际 控制 效果 的 仿真 演示 。 它 们 分 别 是 ; 

。 神经 网 络 模型 预测 控制 ; 

。 神经 网 络 反馈 线性 化 控制 

。 神经 网 络 模型 参考 控制 。 

神经 网 络 控制 通常 包含 两 个 步骤 ， 分 别 是 : 

。 系统 辨识 ; 

。 控制 系统 设计 。 

在 系统 辨识 阶段 ， 主 要 任务 是 建立 受 控 装置 的 神经 网 络 模型 ， 在 控制 设计 阶段 ， 则 使 
用 神经 网 络 模型 来 设计 或 训练 控制 器 网 络 。 对 于 上 述 三 种 网 络 ， 系 统 办 识 阶段 是 完全 相同 
的 ， 而 控制 设计 阶段 则 各 不 相同 。 

( 1 ) 对 于 模型 预测 控制 ， 需 要 应 用 受 控 系 统 模型 对 系统 未 来 的 行为 进行 预测 ， 同 时 应 
用 最 优化 算法 对 最 优化 系统 性 能 的 控制 输入 进行 选择 。 

( 2 ) 对 于 反馈 线性 化 控制 ， 控 制 器 只 是 简单 地 对 受 控 系统 模型 进行 调整 。 

( 3 ) 对 于 模型 参考 预测 ， 控 制 器 是 一 个 经 过 训练 的 用 来 对 装置 进行 控制 的 神经 网 络 
它 跟踪 一 个 参考 模型 ， 而 神经 网 络 系统 状态 模型 则 用 来 对 控制 器 训练 过 程 进行 辅助 。 


神经 网 络 模型 预测 控制 


神经 网 络 预测 控制 模型 使 用 非 线性 神经 网 络 模型 来 预测 未 来 模型 的 性 能 。 在 神经 网 络 
工具 箱 中 ， 受 控 装置 的 控制 输入 信号 由 控制 器 产生 ， 而 控制 输入 在 未 来 一 段 指定 的 时 间 内 
将 模型 性 能 最 优化 。 模 型 预测 的 第 一 步 是 要 建立 神经 网 络 模型 ,对 系统 进行 辨识 ; 第 二 步 
是 使 用 控制 器 来 预测 未 来 神经 网 络 的 性 能 。 

如 前 所 述 ， 这 种 神经 网 络 控制 方法 的 优点 是 ， 对 于 非 线 性 系统 能 够 产生 比较 符合 期 望 
的 稳定 性 。 其 主要 特点 如 下 所 述 。 

( 1 ) 控制 器 应 用 神经 网 络 模型 ， 对 系统 对 所 有 可 能 控制 信号 的 反应 进行 预测 。 

( 2 ) 神经 网 络 系统 模型 的 训练 属于 离线 训练 方式 ， 可 以 选择 任意 的 学 习 批 处 理 算法 。 

(3 ) 选择 某 一 种 优化 算法 ， 对 系统 进行 最 优化 计算 。 
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(4 ) 控制 过 程 中 需要 大 量 地 再 现 计算 数据 。 





15.2.1 ”系统 辨识 


近 几 年 来 ， 神 经 网 络 在 复杂 动力 学 系统 控制 和 辨识 中 的 应 用 受到 了 普遍 的 关注 ， 利 用 
神经 网 络 预测 可 以 解决 很 多 非 线 性 和 非 确定 性 的 控制 问题 。 

利用 神经 网 络 进行 模型 预测 的 第 一 步 就 是 训练 神经 网 络 ， 以 模拟 系统 的 动力 学 特性 。 
系统 输出 与 神经 网 络 输出 之 间 的 预测 误差 用 来 提供 神经 网 络 的 训练 信号 。 整 个 训练 过 程 可 
以 用 图 15-10 表示 。 其 中 zx 为 系统 输入 ，y 为 装置 输出 ， 神 经 网 络 模型 以 上 和 Jr 作为 训练 
输入 样本 向 量 ， 得 到 的 网 络 输出 yw 与 装置 输出 多 相 减 作为 网 络 模型 预测 误差 反馈 给 网 络 ， 
从 而 对 网 络 模型 进行 训练 ， 完 成 对 装置 的 辨识 。 


神经 网 络 模型 










图 15-10 ”神经 网 络 模型 训练 过 程 


15-10 中 的 神经 网 络 模型 利用 当前 输入 和 模型 输出 来 预测 网 络 的 未 来 输出 ， 其 模型 
结构 如 图 15-11 所 示 。 








mk+D 





图 15-11 ”神经 网 络 模型 结构 


从 图 15-11 中 可 以 看 到 ， 预 测 网 络 模型 通常 采用 BP 前 向 网 络 ， + 时刻 的 输入 训练 样本 
为 装置 输入 xD 和 装置 输出 yw(D)， 通 过 一 定 的 时 延 之 后 通过 第 一 层 ( sigmoid 层 )， 以 及 第 
二 层 ( 线性 层 )， 获 得 #+1 时 刻 的 网 络 输出 yd+1)， 同 时 计算 误差 ， 并 采用 误差 反 向 传播 
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的 方式 对 网 络 进行 训练 。 
15.2.2 ”预测 控制 


利用 神经 网 络 进行 模型 预测 控制 ,其 原理 基于 所 谓 的 水 平 后 退 方法 ( Receding Horizon 
Technique，RHT )。 当 神 经 网 络 获得 输入 后 ， 在 指定 的 时 间 内 对 模型 响应 进行 预测 。 预 测 
过 程 使 用 数字 最 优化 程序 来 确定 控制 信号 ， 其 性 能 函数 定义 如 下 


志 过 
7J=YOoru+D-wd+D2+pYGd+iD-ac+ 产 2 
四 反 
其 中 ，NuhNa,…,N, 是 计算 跟踪 误差 和 控制 增益 的 范围 ，y 是 期 望 响应 ，y， 是 网 络 模 
型 响应 ， 变 量 , 是 实验 控制 信号 ， 即 受 控 装置 的 控制 输入 ， 忆 是 控制 增益 平方 和 分 布 的 
因子 。 
网 络 模型 预测 控制 过 程 如 图 15-12 所 示 。 














图 15-12 ”神经 网 络 预测 控制 模型 


如 图 15-12 所 示 ， 控 制 器 是 由 神经 网 络 模型 和 最 优化 模块 组 成 的 ， 最 优化 模块 通常 利 
用 动态 网 络 结构 实现 最 优化 算法 ， 以 确定 实验 控制 信号 x 的 值 。 其 中 ， 期 望 响应 y 为 系统 
输入 ， 最 优化 模块 完成 指标 函数 的 优化 ， 产 生 控 制 信号 wx， 输 出 至 神经 网 络 模型 和 受 控 装 
置 ， 而 网 络 模型 响应 yw 反馈 到 最 优化 模块 作为 优化 计算 的 一 个 输入 ; 另 一 方面 ， 控 制 信 
号 /输出 至 受 控 装置 ， 得 到 系统 输出 yo 


15.2.3 ”预测 控制 的 Simulink 实例 


在 MATLAB R2008b 中 ， 有 一 个 利用 神经 网 络 进行 模型 预测 控制 的 实例 ， 该 实例 为 研 
究 催 化 剂 的 连续 搅拌 反应 器 ( CSTR )， 此 实例 是 基于 Simulink 环境 的 ({ Simulink 是 MATLAB 
环境 下 用 于 系统 建 模 、 动 态 分 析 的 软件 包 ， 关 于 其 详细 介绍 请 参考 第 18 章 )。 下 面 对 此 搅 
拌 系统 实例 进行 介绍 。 


【 例 15-1】 预测 控制 实例 。 如 图 15-13 所 示 ， 要 控制 的 系统 为 生产 某 种 催化 剂 产品 
溶液 的 搅拌 系统 。 此 催化 剂 由 同一 溶质 而 不 同 浓度 的 两 种 溶液 混合 而 成 ， 其 中 浓度 高 的 称 
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为 浓缩 液 ， 浓 度 低 的 称 为 稀释 液 。 这 两 种 溶液 从 上 而 下 注入 一 个 容器 ， 容 器 内 部 的 螺旋 桨 
对 混合 液 进行 搅拌 ， 以 达到 充分 混合 ， 获 得 所 需 特定 浓度 的 产品 液 ， 然 后 输出 。 


此 系统 的 动力 学 模型 可 以 表示 为 如 下 微分 方程 组 : 








Co 
图 15-13 ”连续 搅拌 反应 器 示意 图 


dh(D) 


本 Wi(D)+ wa(D 一 0.2VJn(D 





2 虽 - =(Cn-CoO) 人 ) +(Coa 一 Co(D) 2 5 罗 
其 中 ，ND) 为 液 面 高 度 ，Cs(t) 为 产品 输出 浓度 ，w(t) 为 浓缩 液 的 流速 ， wz(z) 为 稀释 
液 的 输入 流速 ， Cu 为 浓缩 液 的 输入 浓度 ， Co 为 稀释 液 的 输入 浓度 。 设 定 ， Cu =24， 
Coz =0.1;， = 心 =1 为 消耗 率 。 
问题 是 设计 一 个 神经 网 络 预测 控制 器 ， 以 便 调节 稀有 释 液 的 流速 w(f) ， 保 证 产品 具有 
合适 的 浓度 。 为 简化 演示 过 程 ， 可 以 假定 m(t) =0.1。 其 中 ， 液 面 高 度 Mt) 为 不 受 控 量 。 
解 ，(@ 建立 模型 。 在 MATLAB 命令 空间 中 输入 命令 : 


predcstr 


此 命令 将 直接 启动 Simulink 界面 ， 同 时 弹出 如 图 15-14 所 示 窗 口 ， 其 中 包含 了 神经 网 
络 预测 控制 模型 。 


站 ET LT 
































图 15-14 ”predcstr 模型 窗口 
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15-14 所 示 的 窗口 中 包含 了 下 述 几 个 模块 : 神经 网 络 预测 模块 ( NN Predictive 
Controller 和 CSTR 模块 ( Continuous Stirred Tank Reactor )、 随 机 信号 发 生 器 模块 ( Random 
Reference 作 图 形 显示 模块 ( Graph )。 其 中 前 两 个 模块 都 是 MATLAB 提供 的 Simulink 模块 ， 
双击 它们 可 以 查看 其 中 的 具体 内 容 ， 例 如 双击 CSTR 模块 图 标 ， 将 弹出 如 图 15-15 所 示 的 
窗口 。 此 窗口 显示 了 CSTR 系统 的 构成 ， 其 中 内 容 不 再 详细 介绍 。 




























































































图 15-15 ” 受 控 系 统 构成 示意 图 


NN Predictive Controller 模块 是 在 神经 网 络 工具 箱 中 生成 和 复制 过 来 的 , 它 的 输出 信号 
与 CSTR 模块 连接 ， 作 为 控制 信号 ; 而 CSTR 的 输出 信号 又 反馈 输出 到 NN Predictive 
Controller 模块 的 输入 端 ， 作 为 最 优化 的 输入 参考 信号 。 

双击 NN Predictive Controller 模块 图 标 ， 将 弹出 如 图 15-16 所 示 的 新 窗口 。 





提 


图 15-16 Predictive Control 模型 窗口 


通过 此 窗口 ， 可 以 对 该 模型 预测 控制 器 进行 设计 。 在 这 个 窗口 可 以 改变 的 控制 参数 包 
括 : Cost Horizon N2、Control Horizon Nu、Control Weighting Factor Pp 、Search Parameter w 
等 。 其 中 各 参数 的 解释 分 别 如 下 。 

。 Cost Horizon N2: 此 参数 为 用 于 最 小 化 预测 误差 的 时 间 步 数 。 
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。 Control Horizon Nu: 此 参数 为 用 于 最 小 化 控制 增 量 的 时 间 步 数 。 

e Control Weighting Factor p : 此 参数 为 控制 权 值 因子 , 用 于 在 性 能 函数 中 乘 以 控制 增 
量 的 平方 和 。 

。 Search Parameter x : 此 参数 为 搜索 参数 ， 用 来 设 定 一 维 搜索 的 停止 时 间 。 

e。 Minimization Routine， 用 于 选择 最 小 化 搜索 程序 。 

elterations Per Sample Time: 用 于 设置 每 个 采样 时 间 内 的 和 迭代 次 数 。 

es Plant Identification: 单 击 此 按钮 可 以 打开 系统 辨识 窗口 ， 在 控制 器 使 用 之 前 ， 先 对 
系统 进行 辨识 。 

全 系统 辨识 。 

设 定好 模型 参数 的 值 ， 单 击 “Plant Identification” 按钮， 将 打开 如 图 15-17 所 示 的 窗口 。 





Plant Identification 

















15-17 “Plant Identification” 窗 口 


此 窗口 中 包含 有 很 多 模型 辨识 所 需要 的 参数 ， 分 别 解释 如 下 。 

。 Size of Hidden Layer， 用 于 设置 系统 模型 网 络 隐 层 神经 元 数目 。 

e。 Sampling Interval: 用 于 设置 采样 间隔 。 

。 No. Delayed Plant Inputs: 用 于 设置 系统 网 络 模型 的 输入 延迟 。 

e。 No. Delayed Plant Outputs， 用 于 设置 系统 网 络 模型 的 输出 延迟 。 

e Normalize Training Data: 用 于 设置 是 否 采用 premnmx 函数 对 数据 进行 归 一 化 处 理 。 
。 Training Samples， 用 于 设置 训练 样本 的 数目 。 

。Maximum Plant Input:， 用 于 设置 随机 输入 的 波峰 值 

e。 Minimum Plant Input， 用 于 设置 随机 输入 的 波 谷 值 。 

。Maximum Interval Value: 用 于 设置 随机 输入 的 最 大 间隔 。 
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”Minimum Interval Value: 用 于 设置 随机 输入 的 最 小 间隔 。 

。 Limit Output Data， 用 于 选择 系统 输出 是 否 有 界 。 

。*Maximum Plant Output， 用 于 设置 输出 的 最 大 值 。 

*Minimum Plant Output， 用 于 设置 输出 的 最 小 值 。 

”Simulink Plant Model， 选 择 产生 数据 的 Simulink 系统 模型 。 

。 Generate Training Data， 产 生 用 于 训练 的 数据 。 

”Import Data; 从 工作 空间 或 者 一 个 文件 中 导入 数据 。 

”Export Data;， 将 训练 数据 导出 到 工作 空间 或 文件 中 。 

。 Training Epochs: 设置 训练 迭代 次 数 。 

。 Training Function:， 设置 训练 函数 。 

在 此 窗口 中 ， 单 击 “Generate Training Data” 按 钮 ， 会 产生 一 系列 随机 数据 作为 输入 
Simulink 系统 模型 的 训练 样本 数据 ， 这 些 数据 输入 Simulink 系统 模型 后 得 到 输出 数据 ,所 
绘 出 图 形 如 图 15-18 所 示 。 


Plant inpat Output Data 























图 15-18 ”生成 的 随机 训练 样本 数据 


在 图 15-18 中 ， 上 半 部 分 是 输入 模型 的 数据 ， 而 下 半 部 分 是 模型 输出 的 数据 ， 单 击 
"Accept Data ”按钮 ， 就 接受 了 这 些 数据 ; 而 单 击 “Reject Data” 按钮 ， 就 将 丢弃 这 些 数据 ， 
重新 产生 训练 样本 。 

本 例 先 单 击 “Accept Data” 按 钮 ， 然 后 在 “Plant Identification” 窗 口中 单 击 “Train 
Network "按钮 , 即 开始 对 系统 网 络 模型 的 训练 。 训练 过 程 根据 所 选择 的 训练 算法 ({ trainlm ) 
进行 计算 。 这 是 一 种 直接 批 处 理 训练 的 应 用 。 此 时 将 弹出 两 个 图 形 窗口 ， 分 别 为 训练 数据 
曲线 和 验证 数据 曲线 窗口 ， 其 中 训练 数据 曲线 如 图 15-19 所 示 ， 验 证 数据 曲线 如 图 15.20 
所 示 。 
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图 15-19 训练 数据 曲线 图 15-20 “验证 数据 曲线 


以 上 两 图 中 ， 左 上 角 为 随机 输入 数据 ， 右 上 角 为 系统 输出 数据 ， 左下 角 为 误差 曲线 ， 
右 下 角 则 为 网 络 输出 数据 。 


接 下 来 ， 可 以 单 击 “Train Network” 按钮 对 网 络 重新 进行 训练 ， 也 可 以 选择 “Erase 
Generated Data” 然 后 重新 生成 新 的 数据 ， 或 者 单 击 “OK” 按钮 接受 目前 的 系统 模型 ， 并 
且 对 此 闭环 系统 进行 仿真 ， 如 下 面 的 步骤 所 示 。 

合 系统 仿真 。 

单 击 Plant Identification 窗口 中 的 “OK” 按钮 ， 这 将 会 在 NN Predictive Controller 模块 
中 载 入 训练 过 后 的 神经 网 络 系统 模型 。 

在 “Neural Network Predictive Controller” 窗 口中 单 击 “OK” 按钮 ， 将 控制 器 参数 导 
入 到 NN Predictive Controller 模块 中 。 

回 到 Simulink 模型 界面 下 ， 在 “Simulation 菜单 下 选择 “Start” 命 令 ， 就 可 以 开始 
仿真 。 随 着 仿真 的 进行 ， 系统 输出 与 参考 信号 的 曲线 也 实时 地 显示 出 来 ， 如 图 15-21 所 示 。 





图 15-21 ”系统 仿真 结果 
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图 15-21 中 ， 参 考 信号 呈 阶 跃 性 变化 ， 而 系统 的 仿真 输出 则 能 够 很 好 地 跟踪 此 参考 信 
号 的 变化 ， 显 示 了 神经 网 络 模型 预测 控制 的 效果 。 


神经 网 络 反馈 线性 化 控制 (NARMA-L2) 


神经 网 络 反馈 线性 化 控制 ( 又 称 为 NARMA-L2 控制 )， 是 通过 反馈 消除 非 线 性 ， 将 非 
线性 系统 转换 为 线性 系统 来 进行 控制 的 神经 网 络 控制 方法 。 

当 系统 是 伴随 型 特殊 形式 时 ， 应 用 反馈 线性 化 控制 ， 当 系 统 是 伴随 型 模型 估计 时 ， 应 
用 NARMA-L2 控制 。NARMA-L2 控制 系统 具有 下 面 的 特点 。 

( 1 ) 计算 量 相对 较 小 。 

( 2 ) 神经 网 络 系统 模型 的 训练 属于 离线 训练 方式 ， 训练 方法 上 可 以 选择 任意 的 学 习 批 
处 理 算法 。 

( 3 ) 控制 系统 中 具有 唯一 的 在 线 训练 部 分 ， 即 神经 网 络 控制 器 的 一 个 前 向 通路 。 

(4 ) 能 够 应 用 反馈 线性 化 控制 的 系统 必须 是 伴随 型 ， 或 能 够 应 用 伴随 型 模型 估计 。 

本 节 首 先 介绍 反馈 线性 化 模型 ， 以 及 如 何 利用 神经 网 络 进行 系统 辨识 ， 接 下 来 介绍 如 
何 利用 经 过 辨识 的 神经 网 络 模型 来 创建 一 个 控制 器 ， 最 后 介绍 Simulink 提供 的 一 个 
NARMA-L2 控制 系统 ， 并 对 此 系统 进行 说 明 。 








15.3.1 NARMA-L2 系统 辨识 


同 神经 网 络 模型 预测 控制 一 样 ，NARMA-L2 控制 的 第 一 步 也 是 对 受 控 系统 进行 系统 
辨识 。 训 练 一 个 网 络 对 系统 的 前 向 动力 学 特性 进行 复 现 ， 首 先 需要 选择 模型 结构 ， 一 个 用 
于 表征 一 般 离散 非 线性 系统 的 标准 模型 是 非 线性 自 回归 移动 平均 ( NARMA ) 模型 ， 其 计 
算 公式 如 下 ， 

?KK+d)= NIy(), (KE 一 D，.， (KK 一 +JD,x(k),u(k 一 Du 一 m+D] 


其 中 ，x( 妇 是 系统 输入 ， 而 y(k) 为 系统 输出 。 在 系统 辨识 阶段 ， 可 以 对 网 络 进行 训练 
以 便 对 非 线性 函数 N 进行 逼近 。 这 其 实 也 是 利用 NN Predictive Controller 进行 模型 辨识 的 
步骤 。 

如 果 希 望 网 络 输出 能 够 跟随 某 些 参考 轨迹 (k + d) = y(k+d) 的 话 ， 就 要 创建 一 个 下 
列 形式 的 非 线性 控制 器 : 


MG =G[y(D),y(K 一 D…,y(K 一 +D,yr(+d)uK 一 Du 一 m+I 


这 种 控制 器 的 问题 在 于 , 如 果 想 要 训练 一 个 神经 网 络 以 便 创建 函数 G 对 均 方 误差 最 小 
化 的 话 ， 我 们 需要 应 用 动态 反 向 传播 的 方法 ， 而 这 是 一 个 非常 缓慢 的 过 程 。 由 Narendra 和 
Mukhopadhyay 提出 的 一 种 解决 方法 是 : 利用 进行 模型 来 表征 系统 。 此 时 ， 系 统 控制 器 就 
是 基于 NARMA-L2 近似 模型 的 。 
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SUk+ 四 = 了 [0 一 Dy(K 一 m+DKk 一 DuKk 一 下 + 切 
+ SG,y(K 一 D,y(K 一 n+DUKE 一 Da(k 一 丰 +DJa() 
此 模型 是 伴随 形式 的 ， 其 中 下 一 个 控制 器 输入 v(k) 不 包括 在 非 线性 之 内 。 这 种 形式 的 
优势 在 于 可 以 控制 输入 ， 使 得 系统 输出 跟踪 参考 曲线 XK+d)= %(k+ d) 。 最 终 的 控制 器 
形式 如 下 





六 本 rr(k+d) 一 FLy(O,y(K 一 Dy(K 一 +DCK 一 D),…,xu(k 一 普 +D] 
8[y(D,yK 一 D…y(K 一 m+D,u(K 一 Da(k 一 2+DJ] 


但 是 , 直接 使 用 上 述 方程 还 有 一 定 的 问题 ， 因为 首先 需要 通过 同一 时 刻 的 输出 Xp 确 
定 控制 输入 w(kD) 。 因 此 ， 通 常 采 用 下 面 的 模型 


y(k+d)= FIy(,yK 一 D…,y(Kk 一 ma+DuKk 一 1D,…,u(k 一 n+D] 
+8[y(G,yKk 一 DY(K 一 +DK 一 Du 一 n+D]u(k+D 


其 中 ，d > 2。 图 15-22 显示 了 这 种 神经 网 络 系统 模型 的 结构 。 








80 的 神经 网 络 近似 








函数 用 的 神经 网 络 近似 
图 15-22 ”NARMA-L2 神经 网 络 系统 模型 的 结构 


15.3.2 NARMA-L2 控制 器 


使 用 NARMA-L2 模型 ， 得 到 的 控制 器 为 


二 世人 + 四 -IUD,yk 一 DyKk 一 2+DuKk 一 D .ua(K 类 一 靖 二 TD] 
DUKE-D,yKK 一 n+DK 一 DuKk 一 mt+D] 


其 中 ，d >2。 图 15-23 显示 了 NARMA-L2 控制 器 的 结构 





&(K+ITD) 
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图 15-23 NARMA-L2 神经 网 络 控制 器 的 结构 


此 控制 器 可 以 用 在 前 面 提 到 的 NARMA-L2 系统 辨识 模型 上 ， 如 图 15-24 所 示 。 


80 的 神经 网 络 近 似 
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思 的 神经 网 络 





图 15-24 NARMA-L2 神经 网 络 控制 器 的 结构 
15.3.3 NARMA-L2 控制 器 Simulink 实例 


本 节 将 显示 如 何 训练 一 个 NARMA-L2 控制 器 ， 实 现 对 系统 准 识 和 控制 。 此 模型 是 基 
于 Simulink 的 ， 如 下 例 所 示 。 


【 例 15-2】 NARMA-L2 控制 器 实例 。 对 于 图 15-25 所 示 的 系统 ， 有 一 块 磁铁 ， 受 到 
垂直 方向 的 运动 约束 ， 其 下 方 有 一 块 电 磁铁 ， 当 电磁 铁通 电 之 后 ， 就 会 对 上 方 的 磁铁 产生 
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电磁 力 的 作用 。 试 对 此 磁铁 的 位 置 进行 控制 ， 使 得 磁铁 能 够 悬浮 在 空中 而 不 掉 下 来 。 





图 15-25 ”悬浮 磁铁 系统 示意 图 


此 系统 运动 的 动力 学 方程 为 : 
dyO0 ca.POD_ .dy 
dt M y0D M d 


其 中 ， y(r) 为 磁铁 距离 电磁 铁 的 高 度 ， iD) 为 电磁 铁 中 的 电流 强度 ， M 为 磁铁 质量 ， 
g 为 重力 加 速度 。 参 数 8 为 粘 灌 摩 擦 系数 ， 由 磁铁 所 在 容器 的 材料 决定 ，C 为 场 强 常数 ， 
由 电磁 铁 线圈 功 数 和 磁铁 磁性 大 小 决定 。 
解 ， 人 建立 模型 。 在 MATLAB 命令 空间 中 输入 命令 ， 


narmamagleV 


此 命令 将 直接 启动 Simulink 界面 ， 同 时 弹出 如 图 15-26 所 示 窗 口 ， 其 中 包含 了 此 磁铁 
控制 系统 模型 。 

















十 凡 TREETR 汤 
图 15-26 “悬浮 磁铁 控制 系统 Simulink 模型 





在 此 窗口 中 , 包含 磁铁 悬浮 模块 ( Magnet Levitation ) NARMA-L2 控制 器 模块 ， 信 号 
源 模块 ( Random Reference )、 显 示 模 块 ( Graph )。 双击 Magnet Levitation 模块 可 以 查看 其 
内 部 结构 ， 如 图 15-27 所 示 。 


344 多 入 入 





第 15 章 神经 网 络 控制 


图 15-26 中 的 NARMA-L2 控制 器 模块 是 在 神经 网 络 工具 箱 中 生成 和 复制 过 来 的 ， 此 
模块 的 输出 信号 与 悬浮 磁铁 模块 连接 ， 作 为 控制 信号 ; 而 磁铁 悬浮 模块 的 输出 信号 又 反馈 
到 NARMA-L2 控制 器 模块 的 输入 端 。 



















































































JE 1 


悬浮 磁铁 模块 内 部 结构 








图 1 
全 系统 辩 识 。 
双击 NARMA-L2 Controller 模块 图 标 ， 将 弹出 如 图 15-28 所 示 的 新 窗口 。 


有 


图 15-28 NARMA-L2 控制 器 窗口 
此 窗口 与 15.2.3 节 中 介绍 的 “Plant Identification” 窗 口 类 似 ， 只 需要 单 击 “Generate 
Training Data” 按 钮 ， 然 后 单 击 “Accept Data” 按 钮 ， 之 后 再 单 击 “Train Network” 按 钮 
即 可 开始 对 网 络 系统 模型 的 训练 。 其 中 产生 的 训练 数据 如 图 15-29 所 示 。 
经 过 训练 后 ， 输 出 的 结果 如 图 15-30、15-31、15-32 所 示 。 
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aa 






图 15-31 验证 数据 图 15-32 测试 数据 


其 中 ， 图 15-30 为 训练 数据 结果 ， 图 15-31 为 验证 数据 结果 ， 图 15-32 为 测试 数据 结 
果 。 这 几 张 图 中 ， 左 上 角 为 随机 输入 数据 ， 右上 角 为 系统 输出 数据 ， 左 下 角 为 误差 曲线 ， 
右 下 角 则 为 网 络 输出 数据 。 对 网 络 进行 训练 时 将 弹出 如 图 15-33 所 示 的 nntraintool 窗口 。 

全 系统 仿真 。 

单 击 “Plant dentification” 窗 口中 的 “OK” 按 钮 ， 将 会 在 NARMA-L2 Controller 模块 
中 载 入 训练 过 后 的 神经 网 络 系统 模型 。 

回 到 Simaulitk 界面 下 , 单 击 “Simulation” 菜单 下 的 “Start" 选项 , 将 会 得 到 如 图 15-34 
的 结果 。 
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图 15-33 ”nntraintool 窗 图 15-34 “仿真 结果 





神经 网 络 模型 参考 控制 系统 是 由 一 个 控制 器 网 络 和 一 个 系统 模型 网 络 构成 的 ， 其 结构 
如 图 15-35 所 示 。 





图 15-35 ”神经 网 络 模型 参考 控制 原理 


在 控制 时 ， 首 先进 行 受 控 装 置 的 系统 辨识 ， 然 后 训练 控制 器 ， 使 得 系统 输出 能 够 跟踪 
参考 模型 的 输出 。 图 15-36 为 图 15-35 中 神经 网 络 控制 器 与 神经 网 络 装置 模型 的 结构 示意 
图 。 其 中 ， 神 经 网 络 控制 器 的 输入 共有 三 种 类 型 ， 分 别 是 : 

。 延迟 参考 输入 ; 
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图 15-36 ”神经 网 络 控制 器 与 神经 网 络 装置 模型 
。 延迟 控制 器 输出 ; 


。 延迟 系统 输出 。 


对 于 每 一 种 输入 ， 都 可 以 选择 延迟 值 的 大 小 。 典 型 的 情况 是 ， 隐 层 神 经 元 的 数目 随 着 
受 控 装置 的 维 数 而 增长 。 神 经 网 络 系统 模型 包含 两 种 输入 类 型 ， 分 别 是 ， 

。 延迟 控制 器 输出 ; 

。 延迟 系统 输出 。 


同 控制 器 一 样 ， 也 可 以 设置 延迟 的 数目 ， 后 面 将 演示 如 何 对 这 些 参数 进行 设置 。 

下 面 介 绍 如 何 对 神经 网 络 控制 器 进行 训练 ， 实 现 对 系统 的 控制 。 此 模型 实例 是 基于 
Simulink 程序 模块 的 ， 如 下 例 所 示 。 

【 例 15-3】 模型 参考 控制 实例 。 图 15-37 所 示 的 系统 为 
一 个 由 直流 电机 驱动 的 单 臂 机 器 人 , 圆 轮 代表 直流 电机 驱动 转 
轴 , 斜 线 代表 机 器 臂 。 系 统 的 目标 是 控制 此 单 臂 机 器 人 的 运动 。 

此 系统 运动 的 动力 学 方程 为 : 






2 2 
和- 10sing 一 2884 人 
忆 由 


其 中 ， 参 数 / 为 机 器 辟 相 对 竖 直 方向 的 角度 ，u 为 直流 电 。 图 1537 单 和 负 杏 人 系统 
动机 提供 的 转动 力矩 。 希望 对 控制 器 进行 训练 , 从 而 使 得 机 器 辟 的 运动 跟踪 参考 模型 如 下 


其 中 ,六 是 参考 模型 的 输出 ，r 是 输入 参考 信号 。 


解 : 应 用 一 个 5-13-1 结构 的 神经 网 络 控制 器 实现 目标 功能 ， 控制 器 包含 两 个 延迟 参考 输入 、 
两 个 延迟 装置 输出 ， 以 及 一 个 延迟 控制 器 输出 。 采 样 率 设 定 为 0.05so。 
348 多 因 入 入 


第 攻 5 章 ”神经 网 络 控制 





全 建立 模型 。 在 MATLAB 命令 空间 中 输入 命令 : 


mrefrobotarm 


此 命令 将 直接 启动 Simulink 界面 ， 同 时 弹出 如 图 15-38 所 示 窗 口 ， 其 中 包含 了 神经 网 
络 模型 参考 控制 模块 。 
































图 15-38 ”模型 参考 控制 器 Simulink 实例 


此 窗口 包含 : 单 臂 机 器 人 模块 ( Robot Arm )、 模 型 参考 控制 器 模块 、 参 考 信号 源 模块 
( Random Reference ) 和 显示 模块 ( Graph )。 双 击 “Robot Arm” 模 块 图 标 可 以 查看 其 内 部 
结构 ， 如 图 15-39 所 示 。 
































图 15-39 ”Robot Arm 模块 结构 


15-38 中 的 模型 参考 控制 器 模块 是 在 神经 网 络 工具 箱 中 生成 和 复制 过 来 的 ， 此 模块 
的 输出 信号 与 单 臂 机 器 人 模块 连接 ， 作 为 控制 信号 ; 而 单 侣 机 器 人 模块 的 输出 信号 又 反馈 
到 控制 器 模块 的 输入 端 。 

售 系统 辩 识 。 

双击 “Model Reference Controller” 模 块 图 标 ， 将 弹出 如 图 15-40 所 示 的 新 窗口 。 
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图 15-40 ”模型 参考 控制 窗口 


此 窗口 与 15.2.3 节 中 的 “Plant Identification ”窗口 类 似 。 首 先 单 击 "Plant Identification ” 
按钮 ， 将 弹出 “Plant Identification” 窗 口 ， 如 图 15-41 所 示 。 





图 15-41 “Plant Identification” 窗 口 


在 “Plant Identification” 窗 口中 单 击 “Generate Training Data” 按 钮 ， 产生 的 训练 数据 
如 图 15-42 所 示 。 
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图 15-42 ”训练 数据 


然后 单 击 “Accept Data"” 按钮 , 回 到 “Plant Identification” 窗口 ， 单 击 “Train Network" 
按钮 对 网 络 模型 进行 训练 ， 会 显示 如 图 15-43 和 图 15-44 所 示 的 窗口 。 


出 uauwujiul 


二 Lauuutul 





图 15-43 训练 数据 图 15-44 ”nntraintool 窗口 


单 击 “Plant Identification” 窗 口中 的 “OK” 按 钮 ， 回 到 “Model Reference Control” 窗 
口 ， 之 后 再 单 击 “Train Controller” 按 钮 即 可 开始 对 网 络 控制 器 的 训练 。 

程序 将 数据 分 段 输入 网 络 ， 并 且 对 网 络 进行 指定 次 数 的 闪 代 ， 直 到 所 有 训练 数据 都 输 
入 网 络 为 止 。 控 制 器 训练 所 需 的 时 间 要 比 系统 模型 训练 长 很 多 ， 这 是 因为 它 采用 了 动态 反 
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向 传播 算法 。 训 练 完成 之 后 ， 将 会 显示 此 闭环 系统 的 响应 结果 ， 如 图 15-45 所 示 。 

在 图 15-45 中 ， 上 面 的 图 显示 的 是 用 于 训练 的 随机 参考 信号 ， 下 面 的 图 显示 的 是 参考 
模型 的 响应 信号 和 闭环 系统 的 响应 信号 。 系 统 的 响应 信号 应 该 跟踪 参考 模型 的 输入 信号 。 

返回 “Model Reference Control” 窗 口 ， 如 果 控 制 器 的 性 能 不 准确 ， 则 需要 再 次 对 控制 
器 进行 训练 ， 单 击 “Train Controiler” 按 钮 即 可 ， 如 果 需 要 使 用 新 数据 对 其 进行 训练 ， 则 
单 击 “Generate Training Data” 技 钮 或 者 “Import Data” 按 钮 。 需 要 指出 的 是 ， 如 果 系 统 模 
型 不 准确 ， 则 控制 器 的 训练 也 会 受到 影响 。 

侠 系统 仿真 。 

在 “Model Reference Control "窗口 中 单 击 "OK "按钮 , 回 到 Simulink 下 的 "mrefrobotarm 
窗口 ， 选 择 “Simulation” 菜 单 中 的 “Start” 选 项 ， 开 始 系统 仿真 。 绘 出 的 系统 输出 与 参考 
信号 如 图 15-46 所 示 。 








图 15-46 ”仿真 输出 结果 


四 


.9 





本 章 首 先 对 神经 网 络 控制 系统 进行 概述 , 然后 介绍 3 个 基于 Simulink 的 神经 网 络 控制 
系统 的 实例 。 
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故障 诊断 是 近 40 年 发 展 起 来 的 新 学 科 ， 它 是 适应 工程 需要 而 发 展 起 来 的 多 学 科 交 叉 
的 综合 学 科 。 工 业 故 障 诊断 通常 包含 两 种 含义 ， 一 种 是 指 利用 某 些 专用 的 仪器 检测 工业 设 
备 的 运转 是 否 正常 ; 另 一 种 是 指 由 计算 机 完成 工 况 分 析 ， 对 故障 模式 、 故 障 原因 、 故 障 程 
度 等 问题 进行 分 析 、 判 断 ， 得 出 结论 。 

在 各 种 基于 信号 处 理 的 故障 诊断 算法 之 中 ， 神 经 网 络 为 故障 诊断 提供 了 一 种 新 的 解决 
途径 。 特 别 是 对 于 实际 中 难以 建立 数学 模型 的 复杂 系统 ， 神 经 网 络 的 优势 更 为 明显 。 本 章 
将 对 神经 网 络 在 不 同 工 业 领域 内 的 故障 诊断 应 用 进行 实例 说 明和 介绍 ， 主 要 内 容 包括 如 下 
几 部 分 。 

(1 ) 神经 网 络 故障 诊断 概述 。 

( 2 ) 基于 神经 网 络 的 滚动 轴承 故障 诊断 。 

( 3 ) 基于 神经 网 络 的 汽车 ABS 防 抱 死 系 统 故障 诊断 。 

(4 ) 基于 神经 网 络 的 柴油 机 故障 诊断 。 

(5 ) 基于 神经 网 络 的 水 循环 系统 故障 诊断 。 
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现代 化 设备 日 趋 大 型 化 、 复 杂 化 、 自 动 化 和 连续 化 ， 设 备 的 故障 诊断 技术 越 来 越 受 到 
重视 。 如 果 一 台 机 械 设备 在 出 现 故 障 征兆 时 没有 被 及 时 发 现 ， 那 么 故障 发 生 后 ， 轻 则 停工 
停产 ， 经 济 受到 损失 ， 重 则 发 生 重大 事故 ， 后 果 不 堪 设想 。 为 此 ， 研 制 和 开发 出 自动 故障 
诊断 系统 ， 在 出 现 故障 征兆 时 能 够 给 出 预警 信号 ， 及 时 排除 故障 隐患 ， 对 于 现代 企业 来 说 
具有 重大 的 经 济 意义 。 

机 械 故 障 诊断 的 根本 目标 是 确诊 连续 运行 机 器 的 潜在 故障 ， 保 证 机 器 安全 有 效 的 运 
行 。 所 谓 确诊 就 是 能 够 准确 地 诊断 出 机 器 的 故障 类 型 、 故 障 严重 程度 及 故障 的 具体 位 置 。 
从 本 质 上 讲 ， 故 障 诊断 就 是 模式 识别 的 问题 。 

自然 界 的 事物 和 现象 通常 可 分 为 多 个 相似 但 又 不 完全 相同 的 事物 或 个 体 组 成 的 类 别 ， 
人 们 把 这 样 的 类 别称 为 模式 类 或 模式 ， 而 把 其 中 每 一 个 事物 或 现象 称 为 该 模式 的 一 个 样 
本 。 同 类 的 样本 彼此 相似 ， 具 有 某 些 共同 的 特征 ， 不 同类 的 样本 彼此 互 不 相似 。 所 谓 的 模 
式 识别 就 是 从 模式 空间 到 类 别 隶 属 空间 的 正确 映射 。 

在 模式 识别 映射 过 程 中 , 需要 用 数学 语言 来 描述 。 所 以 在 模式 识别 的 学 习 及 识别 之 前 ， 
先 要 对 待 识别 的 目标 进行 抽象 ， 即 对 待 研究 对 象 重要 的 特征 或 属性 进行 测量 并 将 结果 数字 
化 , 或 将 对 象 分 解 并 符号 化 ,形成 特征 矢量 或 符号 串 、 关 系 图 ， 从 而 产生 代表 对 象 的 模式 。 
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故障 诊断 的 关键 是 实现 从 故障 征兆 空间 到 故障 空间 的 映射 ， 从 而 实现 对 故障 的 识别 
和 诊断 ( 模式 识别 )。 传统 的 方法 是 采用 基于 符号 推理 的 专家 系统 ,但 专家 系统 用 于 故障 
诊断 存在 知识 获取 困难 、 组 合 爆炸 和 匹配 冲突 等 难以 克服 的 问题 ， 使 其 应 用 达 不 到 预期 
的 效果 。 

神经 网 络 具有 自学 习 能 力 、 非 线性 映射 能 力 、 对 任意 函数 的 逼近 能 力 、 并 行 计算 能 力 
和 容错 能 力 ， 这 些 能 力 为 构造 新 型 故障 诊断 系统 提供 了 有 力 保障 。 就 运行 过 程 而 言 ， 机 械 
设备 实质 上 是 一 个 复杂 的 非 线 性 动力 系统 ， 特 别 是 在 多 故障 和 非 平稳 状态 下 ， 要 求 模式 识 
别 的 过 程 具有 自 适 应 性 和 鲁 棒 性 ， 也 就 是 要 求 模式 分 类 器 具有 自 适 应 地 处 理由 噪声 引起 的 
模式 失真 的 能 力 ， 能 够 根据 设备 运行 参数 的 变化 调整 分 类 过 程 ， 能 够 根据 输入 模式 的 数据 
对 存储 器 和 分 类 器 的 结构 进行 自 适应 调节 。 基 于 神经 网 络 的 故障 诊断 系统 ， 就 是 用 故障 征 
兆 的 可 信 度 作为 输入 ， 经 过 神经 网 络 的 并 行 数 值 计算 ， 输 出 对 应 故障 的 可 信 度 ， 从 而 完成 
故障 模式 的 识别 ， 因 而 机 械 故 障 诊断 领域 是 神经 网 络 的 重要 应 用 领域 之 一 。 

神经 网 络 应 用 于 故障 诊断 的 步骤 通常 如 下 。 

全 通过 信号 监测 和 分 析 ， 抽 取 反 映 被 检测 对 象 ( 设备 、 部 件 或 零件 等 ) 的 特征 参数 ， 
如 ( x1， 妇 ，.…，xn ) 作为 网 络 的 输入 模式 。 

全 对 被 检测 对 象 的 状态 类 别 进 行 编码 。 例 如 ， 对 于 正常 、 故 障 1、 故 障 2 三 种 状态 ， 
可 将 期 望 输出 编码 为 ,正常 (0，0) 故障 1 (0，1) 故障 2 ( 1，0) 

合 进行 网 络 设计 ， 确 定 网 络 层 数 和 各 层 神 经 元 数 。 输 入 层 单元 数 由 特征 参数 个 数 决 
定 ; 输出 层 单元 数 由 状态 数 和 状态 编码 方式 确定 ; 隐 层 一 般 为 1 层 , 问题 复杂 时 可 取 2 层 
隐 层 单元 数 的 选择 原则 目前 尚 无 理论 依据 ， 可 根据 问题 规模 大 小 赁 经 验 确定 。 

人 后 用 各 种 状态 样本 组 成 训练 样本 ， 输 入 网 络 ， 对 网 络 进行 训练 ， 确 定 各 单元 的 连接 
权 值 。 

命 用 训练 好 的 网 络 对 待 检 对 象 进行 状态 识别 ， 即 把 待 检 对 象 的 特征 参数 作为 网 络 输 
入 ， 根 据 网 络 输出 确定 待 检 对 象 的 状态 类 别 。 

为 提高 网 络 的 故障 诊断 性 能 ， 可 把 使 用 中 发 现 的 错误 判断 作为 训练 样本 加 入 训练 样本 
集 ， 对 网 络 进行 进一步 训练 ， 从 而 使 网 络 的 性 能 得 到 改善 

以 下 各 节 介 绍 神经 网 络 故障 诊断 的 应 用 实例 。 





略 到 基于 神经 网 络 的 液 动 轴承 故障 论 





16.2.1， 问 题 背景 


滚动 轴承 是 由 内 环 、 外 环 、 滚 动 体 和 保持 架 4 种 元 件 组 成 。 通 常 ， 其 内 环 与 机 械 传动 
轴 的 轴 颈 过 盈 配 合 连接 ， 工 作 时 与 轴 一 起 转动 ， 外 环 安装 在 轴承 座 、 箱 体 或 者 其 他 支撑 物 
上 ， 工 作 时 一 般 外 环 固定 ， 但 也 有 外 环 回转 、 内 环 不 动 或 内 外 环 分 别 按 不 同 的 转速 回转 的 
使 用 情况 。 

滚动 体 是 滚动 轴承 的 核心 元 件 ， 它 使 相对 运动 表面 间 的 滑动 摩擦 变 成 滚动 摩擦。 滚动 


354 办 基 入 条 





第 了 6 章 ”神经 网 络 故障 诊断 


体 的 形式 有 球形 、 圆 柱 形 、 圆 锥 形 、 鼓 形 等 。 在 滚动 轴承 内 外 环 上 都 有 凹 槽 滚 道 ， 它 们 起 
着 降低 接触 应 力 和 限制 滚动 轴承 轴 向 移动 的 作用 。 保持 架 使 滚动 体 等 距离 分 布 并 减少 滚动 
体 间 的 摩擦 和 磨损 。 如 果 没 有 保持 架 ， 相 邻 滚动 体 将 直接 接触 ， 且 相对 摩擦 速度 是 表面 速 
度 的 两 倍 ， 发 热 和 磨损 都 较 大 。 

滚动 轴承 ( 球 轴承 ) 典型 结构 示意 如 图 16-1 所 示 。 





图 16-1 典型 滚珠 轴承 结构 


滚动 轴承 在 工作 过 程 中 ， 由 于 装配 不 当 、 涧 滑 不 良 、 水 分 和 异物 侵入 、 腐蚀 和 过 载 等 
都 可 能 使 轴承 损坏 。 滚 动 轴承 主要 损伤 形式 包括 ， 

。 磨损 失效 ; 

。 丫 劳 失效 ， 

。 腐蚀 失效 ， 

。 断裂 失效 ; 

。 压 痕 失效 ; 

。 胶合 失效 ， 

。 保持 架 损坏 。 

滚动 轴承 故障 诊断 的 目的 是 保证 轴承 在 一 定 的 工作 环境 中 承受 一 定 荷载 以 一 定 的 转 
速 运转 、 在 一 定 的 工作 期 间 内 可 靠 有 效 地 运行 ， 以 保证 整个 机 器 的 工作 精度 。 与 此 目的 相 
对 应 ， 轴 和 承 故障 诊断 就 要 通过 对 能 够 反映 轴承 工作 状态 的 信号 进行 观测 、 分 析 和 处 理 来 识 
别 轴承 的 状态 。 所 以 ， 从 一 定 程度 上 说 ， 轴 承 故障 诊断 就 是 轴承 的 状态 识别 。 

完整 的 轴承 故障 诊断 过 程 包括 以 下 5 个 方面 的 内 容 。 

(1 ) 信号 测 取 。 根 据 轴承 的 工作 环境 和 性 质 ， 选 择 并 测量 能 够 反映 轴承 工 况 或 状态 的 
信号 。 

(2 ) 特征 提取 。 以 一 定 的 信号 分 析 与 处 理 方法 从 测量 的 信号 中 抽取 出 能 够 反映 轴承 状 
态 的 有 用 信息 。 

( 3 ) 状态 识别 。 以 一 定 的 状态 识别 方法 识别 轴承 的 状态 ， 即 简单 判断 轴承 工作 是 否 有 
故障 。 

(4 ) 状态 分 析 。 根 据 征兆 ， 进 一 步 分 析 有 关 状态 的 情况 以 及 发 展 趋势 。 当 有 故障 时 ， 
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详细 分 析 故 障 类 型 、 性 质 、 部 位 、 产 生 原因 与 趋势 等 。 

( 5 ) 决策 干预 。 根 据 轴 承 状 态 及 其 发 展 趋势 ， 做 出 决策 ， 如 调整 、 控 制 ， 或 继续 监视 
等 

轴承 故障 诊断 的 目的 是 从 故障 定位 到 确定 故障 性 质 ， 进 而 确定 故障 发 生 的 程度 。 由 于 
神经 网 络 具有 处 理 复杂 多 模式 的 能 力 ， 以 及 进行 联想 、 推 测 和 记忆 的 功能 ， 因 而 适 于 应 用 
在 滚珠 轴承 的 故障 诊断 上 。 下 面 介绍 一 个 故障 诊断 实例 。 


题 实例 


【 例 16-1】 ”轴承 故障 诊断 实例 。 利 用 BP 神经 网 络 对 石油 钻井 的 绞车 及 传动 机 组 滚 
动 轴承 进行 故障 诊断 ， 能 够 在 轴承 早期 故障 时 发 出 预警 信号 ， 提 前 对 将 要 发 生 故 障 的 轴承 
进行 维修 或 更 换 ， 缩 短 停工 停产 时 间 和 减 小 维修 费用 ， 从 而 使 石油 生产 损失 减少 到 最 低 ， 
保证 石油 生产 顺利 安全 进行 。 

选取 某 型 减速 器 的 主动 轴 滚 动 轴承 的 4 个 特征 参数 ， 包 括 均 方 根 值 、 峭 度 、 谐 波 指标 
和 SQ 参数 ， 这 4 个 参数 组 成 输入 样本 向 量 ， 实 测 数据 如 表 16-1 所 示 。 








16.2.2 让 


表 16-1 ”试验 轴承 特征 参数 












































0.64 
0468 
正常 新 轴承 091 人 
正常 新 轴承 0469 138 0.68 oo 
内 团 点 独 8.24 2.23 0.99 2 
滚珠 点 蚀 2.01 1.65 094 4.39 
保持 架 损 坏 093 133 073 1.54 
外 图 严重 裂纹 3.89 | ao 四 加 201 
外 图 较 轻 裂纹 1.65 1.66 09 4.48 
| 辣 光 1.35 1.39 095 2.89 





解 : G 人 定义 输入 样本 数据 。 从 表 16-1 的 10 组 数据 中 选择 7 组 作为 输入 样本 , 在 MATLAB 
命令 空间 中 输入 命令 : 





pll=[0.64 1.37 0.71 0.78] 7 
P12=[0.68 1I.31 0.64 1 .31] 
B21=(1.65 1.66 0.9 4.48] ' 
P22=[1.35 1.39 0.95 2.89]'; 
P31=[8.24 2.23 0.99 2] 

P41=[2.01 1.65 0.94 4.39] 7 


P51=[0.93 1.33 0.73 1.54] 
P=[P11 P12 P21 P22 BP31 P41 P51]? 


合 对 输出 状态 进行 编码 ， 输 出 为 四 维 向 量 ， 定 义 期 望 输出 向 量 如 表 16-2 所 示 。 
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表 16-2 ”轴承 状态 编码 对 照 表 


类 别 号 轴承 状态 输出 向 量 


























1 正常 轴承 {0000) 
2 外 图 裂 纹 (1000) 
| 内 图 点 蚀 (0100) 
4 滚珠 点 蚀 (0010) 
5 保持 架 损坏 10001) 





定义 输出 向 量 。 输 入 命令 : 


tll=[0000]'5 
tl2=[0 0 0 0]'7 
上 21=[1 0 0 0]' 
t22=[1 0 0 0] 
t31=[0 1 0 0]'7 
t41=[0 0 1 0]' 
t51=[0 001]'7 
t=[tll tl12 13 t21 t22 t31 c41 t51]) 


全 构建 Bp 神经 网 络 ， 网 络 参数 如 表 16-3 所 示 。 


表 16-3”BP 神经 网 络 参数 设 定 
隐 层 神经 元 数目 





[8&, 4] 


接 下 来 应 用 输入 和 输出 样本 向 量 对 网 络 进行 训练 。 输 入 命令 ， 


net=newff (minmax(P)，[8,4],{'logsig'，'purelin'},'trainlm') 
net ,trainpParam.show = 100， 

net .trainParam.epoch = 2000， 

net .trainParam.goal= le-3， 

[net ,tr]=train(net,P,)， 


训练 过 程 中 ， 网 络 误差 的 变化 情形 如 图 16-2 所 示 。 











图 16-2 ”网 络 训练 过 程 中 的 误差 变化 曲线 
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全 利用 所 有 10 个 样本 对 经 过 训练 的 神经 网 络 进行 测试 检验 。 输 入 如 下 命令 : 


Ptestll=[0.64 1.37 0.71 0.78] 1 
Ptest12=10.68 1.31 0.64 1.31] "7 
Ptest1l3=[0.91 1.35 0.75 1.59]'; 
Ptest14=[0.69 1.38 0.68 0.9]' 
Ptest21=[3.89 2.01 0.88 20.1]1 7 
Ptest22=[1.65 1.66 0.9 4.48] 
Ptesc23=[1.35 1.39 0.95 2.89] 7 
Ptest31=[8.24 2.23 0.99 2] 7 
Ptest41=[2.01 1.65 0.94 4.39]'7 
Ptest51=[0.93 1.33 0.73 1.54]' 7 
Ptest=[Ptest11l Ptest12 Ptest13 Ptest14 Ptest21 Ptest22 Ptest23 Ptest31 
Ptest41 Ptest51]; 
result_cest = sim(ner，Ptest) 


输出 结果 为 ， 


result_test = 
0.0002 0.0009 -0.0003 -0.0051 
-0.0010 -0.0016 0.0002 -0.0047 
0.0518 0.0268 -0.0104 1.0687 
0.0318 0.0183 -0.0072 -0.3239 
0.5137 -0.1727 0.0008 1.7685 
0.9999 -0.0019 0.0017 -0.0042 
0.9998 0.0011 -0.0005 0.0017 
0.0003 0.9979 0.0005 -0.0046 
0.0005 -0.0018 1.0011 -0.0035 
0.0006 0.0001 -0.0000 0.9939 


绘 成 表格 如 表 16-4 所 示 。 





表 16-4 诊断 结果 
实际 轴承 状态 诊断 数据 
类 别 1 0.0008883 -0.000261 


-0.001 
ke 








0.99994 -0.001884 0.0017347 





0.999806 0.0011026 -0.000465 





0.000274 0.9978975 0.0005375 





0.000489 -0.001779 1.0010996 

















0.000591 0.0001066 -2.03E-05 








可 以 看 到 ， 表 中 加 灰 底 表示 的 数据 ， 即 第 三 个 正常 样本 、 外 鲜 严 重 裂纹 样本 的 诊断 出 
现 了 错误 ， 均 误 判 为 类 别 5。 在 训练 样本 中 加 入 这 两 个 样本 ， 重 新 对 网 络 进行 训练 后 再 诊 
断 ， 同 时 改变 网 络 参 数 ， 设 置 中 间 层 为 10 个 神经 元 ， 则 可 以 纠正 这 两 处 错误 。 
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再 次 进行 训练 ， 网 络 的 误差 曲线 如 图 16-3 所 示 。 


va Tooed prnance aa epeeh 的 








图 16-3 ”再 次 训练 过 程 中 误差 变化 曲线 
训练 经 过 66 次 迭代 之 后 达到 了 期 望 误差 限 ， 对 样本 重新 诊断 的 结果 如 表 16-5 所 示 。 


表 16-5 ”再 次 诊断 的 结果 








实际 轴承 状态 诊断 数据 











类 别 1 0.00507 0.0017823 | 0005497 -0.00384 类 别 1 
类 别 1 | -omo 0.0005237 -0.004101 ooossl5 | 类 别 1 











类 别 1 0.008517 0.0007454 0.003831 0.057907 类 别 1 
类 别 1 -0.07063 0406827 | -006163 -0.00869 类 别 1 
1.027242 1.03E-05 -0.007776 0.012847 类 别 2 
0.999035 0.0008227 0.0031204 -oo8 | 类 别 2 
类 别 2 0.997089 0.0024052 0.0020056 -0.00587 类 别 2 
类 别 3 | 0.020507 0.9818684 0.0068985 0.052362 类 别 3 
0.9990207 
-2.95E-03 





















































-0.0002 








0.940167 


















可 以 看 到 ， 经 重新 训练 改进 后 ， 神 经 网 络 对 各 个 样本 的 诊断 结果 均 正 确 。 


基于 神经 网 络 的 汽车 防 抱 死 系统 故障 诊断 





16.3.1 ”问题 背景 


汽车 故障 诊断 是 依靠 先进 的 传感器 技术 和 检测 技术 ， 采 集 汽车 各 个 系统 的 各 种 动态 信 
息 ， 并 对 这 些 信息 进行 分 析 、 处 理 、 区 分 、 识 别 ， 确 认 其 是 否 属 异常 表现 ， 预 测 其 发 展 趋 
势 ， 查 明 其 产生 原因 、 发 生 部 位 和 严重 程度 ， 提 出 针对 性 的 维修 措施 和 处 理 方法 。 

车 轮 抱 死 将 导致 汽车 可 能 会 出 现下 面 三 种 情况 。 

( 1 ) 制 动 距离 变 长 。 

(2 ) 方向 稳定 性 变 差 ， 出 现 侧 滑 现象 ， 严 重 时 出 现 旋转 掉头 。 
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( 3 ) 方向 操纵 性 丧失 ， 驾 驶 员 不 能 控制 汽车 的 行驶 方向 。 

防 抱 死 制 动 系统 ( Antilock Braking System，ABS ) 是 一 种 主动 安全 装置 ， 它 在 制 动 
过 程 中 根据 “车 辆 -路 面 " 状况 ， 采 用 电子 控制 方式 自动 调节 车 轮 的 制 动 力矩 来 达到 防止 车 
轮 抱 死 的 目的 。ABS 的 引入 不 仅 可 以 防止 制 动 过程 中 后 轮 抱 死 造 成 的 侧 滑 甩 尾 , 同时 可 以 
防止 前 轮 抱 死 而 丧失 转向 能 力 。 所 以 ABS 是 一 种 有 效 的 车 辆 安全 装置 。 

对 于 ABS 的 故障 诊断 ， 我 们 可 以 通过 对 ABS 的 执行 器 和 传感器 的 诊断 来 减少 或 避免 
ABS 故障 的 发 生 。 在 汽车 ABS 中 ， 电 磁 闪 是 一 个 关键 性 部 件 ， 当 电 磁 阀 发 生 故 障 时 ， 应 
该 关闭 ABS， 进 行 常规 制 动 。ABS 中 ，ECU 为 电子 控制 单元 ， 对 电磁 阀 进行 控制 ， 控 制 
信号 即 是 输出 信号 。 因 此 ， 要 想 对 各 电磁 阀 的 工作 情况 进行 诊断 ， 一 般 要 增设 故障 诊断 电 
路 ， 即 ECU 向 执行 器 发 出 一 个 控制 信号 ， 执 行 器 要 有 一 条 专用 回路 来 向 ECU 反馈 其 执行 
情况 。 

不 同 公司 开发 的 ABS， 其 电子 控制 单元 和 控制 逻辑 一 般 不 同 ， 但 电磁 阀 的 结构 形式 和 
工作 原理 却 基 本 类 似 。 图 16-3 所 示 为 某 重型 商用 车 ABS 的 基本 组 成 示意 图 。 


ss 


16-3” 某 重型 商用 车 ABS 示意 图 








由 图 16-3 中 可 以 看 出 ，' 制 动 压力 调节 器 ， 即 电磁 阅 ， 是 ABS 中 最 主要 的 执行 机 构 ， 
它 串 联 在 气 制 动 管 路 中 。 每 个 控制 通道 中 各 设置 一 个 制 动 压力 调节 器 即 制 动 气 室 )， 每 
个 制 动 压力 调节 器 分 别 对 相应 车 轮 进行 控制 。 它 接收 来 自 ECU 的 电压 信号 ， 便 可 实施 增 
压 、 减 压 、 保 压 等 动作 ， 以 控制 制 动 力 ， 达到 制 动 过程 中 车 轮 既 不 抱 死 又 能 较 好 地 利用 路 
面 峰值 附着 系数 的 目的 。 调 节 器 的 结构 原理 及 性 能 特征 对 ABS 的 控制 品质 具有 非常 重要 
的 影响 。 

如 果 汽车 ABS 执行 器 与 传感器 发 生 故 障 ， 驾 驶 员 踏 下 脚 踏 板 时 ， 气体 压力 将 直接 进 
入 制 动 气 室 ， 车 轮 突然 抱 死 。 

BP 神经 网 络 由 于 具有 较 强 的 非 线性 映射 能 力 而 被 广泛 应 用 于 故障 诊断 领域 。 它 通 过 
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对 故障 实例 的 训练 和 学 习 ， 用 分 布 在 神经 网 络 中 的 连接 权 值 来 表达 所 学 习 的 故障 诊断 知 
识 ， 具 有 对 故障 的 联想 记忆 、 模 式 匹配 和 相似 归纳 的 能 力 ， 可 以 实现 故障 与 征兆 之 间 复 杂 
的 非 线性 映射 关系 ， 因 此 ， 此 处 采用 BP 神经 网 络 对 汽车 ABS 执行 器 与 传感器 发 生 故 障 时 
的 行为 模式 进行 识别 与 诊断 。 


16.3.2 ”问题 实例 


【 例 16-2〗  ABS 防 抱 死 系统 故障 诊断 实例 。 利 用 BP 神经 网 络 对 某 型 卡车 的 ABS 故 
障 模式 进行 诊断 。 

首先 对 调节 器 故障 类 型 进行 分 类 ， 故 障 原因 分 为 5 类， 以 y1、72、y3、yJ4、y5 分 别 代 
表 无 故障 、 左 前 调节 器 故障 、 右 前 调节 器 故障 、 左 后 调节 器 故障 和 右 后 调节 器 故障 。 以 故 
障 模 式 X = ( xz1， 友 ，xz9， 友 ，x5，x6 ) 作为 输入 ， 各 故障 模式 x 分 量 分 别 代表 纵向 车 速 、 
侧 向 车 速 以 及 四 轮 轮 速 的 相应 变化 。 以 故障 模式 各 分 量 的 采集 数据 作为 BP 神经 网 络 网 络 
输入 ， 以 故障 原因 作为 神经 网 络 的 输出 ， 进 行 故障 模式 诊断 。 

取 50 个 样本 ， 分 别 为 0.3s、0.4s、0.5s、0.6s、1.5s、1.8s、3.28、3.8s、4.28、4.58 时 
的 速度 值 ， 采 集 的 样本 具体 如 表 16-6 所 示 ( 表 中 各 速度 均 为 相对 数值 ) 


表 16-6 ”调节 器 (ABS 闪 ) 故障 时 采集 的 速度 数据 

















































































故障 类 型 纵向 车 速 
无 故障 (0.3s) 22.082 0 21.069 21.069 21.308 21.308 
无 故障 ( 0.4s ) 21.813 0 20673 20.673 20.884 20.884 
无 故障 (05s ) 可 509 0 20299 20299 2047 20.47 
无 故障 (0.6s ) 21.179 0 19.928 | 20.072 20072 
无 故障 ( 1.5s) 17781 0 16.615 16.615 16.684 16.684 
无 故障 ( L.8s ) 16.602 0 | 531 15351 15.572 15.572 
无 故障 ( 3.2s ) 11.077 匠 10347 10347 10388 10388 ] 
无 故障 (3.8s ) 8.7086 0 8.1346 8.1346 8.1668 8.1668 
无 故障 ( 4.2s ) 7.1293 0 6.6594 6.6594 6.6857 6.6857 
无 故障 ( 4.5s ) 5.9448 0 5.553 | 5553 5.575 | 5575 ] 
左前 故障 ( 0.3s) | 21.813 0.39464 13.601 20.947 | 203553 21.104 
左前 故障 ( 0.4s ) | 21.484 0.78104 0 20.504 19.87 20.702 
左前 故障 { 0.5s ) | 24 1.199 0 20.099 19.191 20.294 
左前 故障 (06s) | 20.77 1.6298 0 19.692 18.375 19.879 
左前 故障 ( 1.5s ) 16.683 5.3032 0 15.667 0 15.747 
左前 故障 ( 1.8s ) 15.134 6.3275 0 14.188 0 | 14.229 
左前 故障 ( 3.2s ) | 6.1988 10.297 0 5.6033 0 5.52 
左前 故障 ( 3.8s ) “| 0.62346 1L.198 0 0 0 0 
左前 故障 (4.2s) | 0 11.207 0 属 0 0 
左前 故障 (45s) | 0 11.207 0 0 0 0 
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续 表 
故障 类 型 CT 区 Z7 攻 三 Z 强 医 荆 并 加 | 

右前 故障 (03s) | 21.813 -03946 20.947 13.601 21.104 20.553 | 

右前 故障 (0.4s) | 21.484 -0781 | 20so 0 20.702 19.87 

右前 故障 ( 0.5s) | 21.14 一 1.199 20.099 0 20.294 19.191 

右前 故障 (06s) | 2077 一 1.6298 19.692 0 19.879 18.375 

右前 故障 ( 1.5s ) 16.683 -5.3032 15.667 0 15.747 0 

右前 故障 ( 1.8s ) 15.134 -63275 14.188 0 14.229 0 

右前 故障 { 3.2s ) | am -10297 5.6033 0 5.52 0 

右前 故障 ( 3.8s ) “| 0.62334 一 11.198 四 0 0 0 

右前 故障 (4.2s) | 0 -1.207 0 0 0 0 

右前 故 谭 145) | 0 -am | 0 0 0 

左 后 故障 (03s) | 21.953 | onaoe6 | 20891 21.039 18.766 ] 21.217 

左 后 故障 (0.4s) | 21.619 0.39155 20.362 20.607 12.813 20793 

左 后 故障 ( 0.5s ) | 229 0.65987 19.884 20.196 0 | 203o8 

左 后 故障 (06s) | 20927 | os | 19472 19.804 0 19.998 

左 后 故障 ( 1.5s) 17.236 3.4358 15.966 16.176 |。 16.27 

左 后 故障 ( 1.8s ) 15.894 | 56 | 5784 | so9 0 14.972 

左 后 故障 ( 3.2s ) “| 9.1394 6.8422 夺 | 8.6274 8.4861 | 8.4864 

左 后 故障 (3.8s ) “| 5.961 7.655 5.7093 5.4665 0 5.4482 

左 后 故障 (42s) | 3.723 sos 3.6475 3.3386 0 3.3163 

左 后 故障 (45s) | 19715 8.2341 2.0296 | 16719 0 | 1.6552 

右 后 故障 (03s) | 21.953 -0.1806 21.039 20.891 21.217 18.766 

右 后 故障 (0.4s】 | 21.619 -03915 20.607 20.362 20.193 12.873 

右 后 故障 (05s) | 21.279 -0.6598 | 2 196 19.884 20.398 0 

右 后 故障 (06s) “| 20.927 -0.9463 19.804 19.472 19.998 | 0 

寺 一 

右 后 故障 ( 1.5s ) 17.236 -3.4358 16.176 15.966 16.27 0 

右 后 故障 ( 1.8s ) | 5 506 | ao9 | 7a4 14.972 | 

右 后 故障 ( 3.2s ) | 9.1394 国 | -6.8422 8.4861 8.6274 8.4864 0 

右 后 故障 ( 3.8s) | 5.961 -7.655 5.4665 5.7093 5.4482 0 

右 后 故障 (4.2s) “| 3.723 -8.0448 3.3386 | 5605 3.3163 0 

右 后 故障 ( 45s ) 1.9715 1.6719 0 
解 ，@ 定义 输入 样本 数据 ， 从 表 16-6 的 50 组 数据 中 选择 45 组 作为 输入 样本 ， 此 处 取 
0.3s、0.4s、0.5s、0.6s、1.8s、3.28、3.8s、4.2s、4.5s 时 的 9 组 速度 值 样本 作为 训练 样本 ， 
1.5s 时 的 速度 值 作为 检测 样本 ,将 输入 样本 存储 于 Excel 文件 16_2_P.xls 中 ,利用 MATLAB 


命令 读 取 。 
在 MATLAB 命令 空间 中 输入 命令 : 


[filename，pathname] = uigetfile('11-2-P.x1S ) 7 
file=[pathname filename]7 
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X=xlsread(file) 7 
P=x7 
Pp=p' 


己 就 是 定义 的 输入 样本 向 量 。 
他 首先 对 故障 类 型 进行 编码 ， 编 码 如 表 16-7 所 示 。 


表 16-7 ”调节 器 输出 向 量 编码 表 















(10000) 
左前 故障 (01000) 
右前 故障 (00100) 
(00010) 
(00001) 







































输出 向 量 为 5 维 向 量 ， 其 中 故障 类 型 位 为 1 则 代表 发 生 了 相应 的 故障 。 接 下 来 定义 期 
望 输出 响应 向 量 。 输 入 命令 


T=zeros(45,5) 
for j=0:4 
for i=j*9+1:jw*9+9 
T(i,j+l)=1; 
end 
end 
TeT' 


7 为 定义 的 期 望 响应 向 量 。 
人 鲜 构建 BP 神经 网 络 ， 网 络 参数 如 表 16-8 所 示 。 


表 16-8”BP 神经 网 络 参数 
各 层 神经 元 数目 传递 函数 





《Yogsig',purclin' 





接 下 来 对 网 络 进行 训练 。 输 入 命令 ， 


net=newff (minmax(P),[12,5],{'1ogsig','purelin'),'trainlm') 

net .上 rainParam.show = 100， 

net .上 trainParam.epoch = 2000， 

net .rainParam.goal= le-3， 

[net,tr]=train (net,p,T) ， 

执行 上 面 的 命令 ， 弹 出 nntraintool 窗口 ， 单 击 窗口 中 的 “Performance” 按 钮 ， 绘 出 曲 
线 如 图 16-4 所 示 。 

可 以 看 到 ， 经 过 13 次 欠 代 ， 网 络 达到 了 设 定 的 误差 性 能 目标 。 

国 将 15s 时 的 数据 存 入 Excel 文件 16_2_Ptest xls, 利用 xlsread 命令 读 取 输 入 检验 向 
量 ， 对 网 络 诊断 效果 进行 测试 。 输 入 命令 : 


[filename，pathname] = uigetfile('16_2_Ptest.xls') 
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file=[pathname filename]7 
xtest=xlsreaG(file) 7 
ptest=xtest' 

result_test = sim(ner，Pptest)' 












图 16-4 ”训练 过 程 中 的 误差 变化 曲线 
仿真 输出 结果 为 : 


result_test = 
0.9650 -0.0093 0.0507 -0.0257 -0.0002 
0.0675 1.0615 -0.1104 0.0983 ” -0.1219 
-0:0246 -0.0324 0.9633 0.0564 0.0539 
0.0782 0.0256 -0.0828 1.0163 -0.0356 
-0.0141 -0.0353 0.0154 -0.0153 1.0427 


将 结果 整理 为 表格 ， 即 如 表 16-9 所 示 。 


表 16-9 诊断 结果 
实际 故障 状态 

无 故障 ( 1.5s) 

左前 故障 ( 1.5s) 











右前 故障 ( 1.5s ) 
左 后 故障 ( 1.5s) 
右 后 故障 ( 1.5s) 


可 见 ， 训 练 后 的 网 络 对 ABS 故障 模式 的 诊断 结果 完全 正确 。 























基于 神经 网 络 的 柴油 机 故障 诊断 





16.4.1 ”问题 背景 


柴油 机 作为 大 部 分 农业 机 械 的 动力 设备 ， 其 运行 状况 的 好 坏 直接 影响 着 农民 的 经 济 效 
益 。 另 外 , 柴油 机 也 可 作为 车 辆 、 船 舶 、 电站 等 常用 设备 的 动力 装置 , 其 基本 结构 如 图 16-5 
所 示 。 因 此 ， 对 柴油 机 进行 状态 检测 和 故障 诊断 ， 及 时 准确 地 排除 故障 ， 确 保 设备 安全 运 
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行 十 分 重要 。 


燃 科 顺 


排 气门 射 器 


活塞 





图 16-5 基本 二 冲程 柴油 机 结构 


柴油 机 的 主要 故障 类 型 可 分 为 两 大 类 : 一 类 是 机 械 式 故 障 , 如 各 种 间隙 因 磨损 而 增 大 ， 
引起 振动 的 幅 频 变 化 ; 另 一 类 是 燃烧 系统 的 热力 学 故障 ， 如 喷 油 角 变 化 ， 进 排 气 机 构 故 障 
等 。 基 于 柴油 机 振动 信号 的 神经 网 络 可 以 对 以 上 各 种 故障 模式 进行 诊断 以 及 甄别 。 现 将 柴 
油 机 主要 的 故障 形式 列举 如 下 。 

(1 ) 气缸 -活塞 故障 。 

( 2 ) 曲柄 - 连 杆 机 构 故 障 。 

(3 ) 活塞 环 漏 气 。 

(4 ) 喷 油 角 变 化 。 

(5 ) 燃油 署 化 质量 不 良 。 

(6 ) 气门 机 构 故 障 。 

(7 ) 气门 漏 气 。 

基于 神经 网 络 的 诊断 方法 就 是 利用 神经 网 络 对 柴油 机 故障 进行 模式 分 类 。 神 经 网 络 直 
接 用 于 故障 诊断 时 ， 要 挑选 特征 参数 组 成 输入 向 量 ， 以 故障 原因 作为 输出 向 量 ， 利 用 典型 
样本 学 习 所 得 权 值 进 行 模式 识别 。 

对 于 故障 信号 的 选择 ， 可 以 测量 振动 信号 ， 也 可 以 测量 气体 最 高 爆发 压力 、 油 压 波形 
圈 、 高 压 油管 的 振动 信号 ， 两 种 方法 各 有 各 的 特点 。 相 对 来 说 ， 振 动 信号 的 测量 更 简单 易 
行 。 

另 一 方面 ， 柴 油 机 工作 时 产生 的 振动 信号 包含 着 极为 丰富 的 信息 ， 是 反映 系统 状态 及 
其 变化 规律 的 主要 信号 ， 利 用 振动 信号 对 故障 进行 诊断 ， 是 柴油 机 故障 诊断 中 最 有 效 、 最 
常用 的 方法 。 需 要 指出 的 是 ， 故 障 征兆 集 的 设计 ， 即 故障 信息 特征 量 的 提取 对 故障 诊断 至 
关 重 要 。 特 征 量 过 多 ， 势 必 造 成 网 络 训练 、 决 策 计算 量 过 大 ， 不 易 得 到 正确 的 结果 ， 但 是 
特征 量 过 少 ， 判 据 不 足 ， 诊 断 效 果 也 不 好 。 
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基于 神经 网 络 的 柴油 机 振动 信号 故障 诊断 分 3 步 实现 。 

人 @ 通过 试验 获得 给 定 工 况 在 设 定 故 障 和 无 故障 状态 下 的 过 程 参数 ， 经 预 处 理 提取 故 
障 征兆 集 数据 ， 归 一 化 为 网 络 输入 模式 。 

全 建立 神经 网 络 系统 ,用 已 知 故障 征兆 -故障 模式 的 样本 集训 练 网 络 ， 使 其 达到 预 设 
的 诊断 精度 ， 得 出 标准 故障 模式 。 

合 实时 输入 故障 征兆 向 量 进行 测试 ， 获 得 该 状态 下 的 网 络 输出 模式 ， 然 后 对 网 络 输 
出 进行 后 处 理 ， 再 与 标准 故障 模式 进行 对 比 ， 获 得 诊断 结果 ， 即 故障 类 型 。 


16.4.2 ”问题 实例 


【 例 16-3】 柴油 机 故障 诊断 实例 。 柴 油 机 表面 振动 信号 包含 着 丰富 的 工作 状态 信息 和 
故障 特征 信息 ， 从 其 表面 振动 信号 中 提取 时 域 特征 参数 ， 可 以 有 效 地 识别 柴油 机 工作 状态 。 
通过 实验 采集 振动 信号 作为 识别 故障 的 原始 依据 , 建立 基于 振动 信号 的 柴油 机 故障 诊断 神经 
网 络 ， 并 对 网 络 进行 训练 得 出 标准 故障 模式 ， 运 用 该 神经 网 络 实现 柴油 机 的 故障 诊断 。 


柴油 机 故障 模式 集 包括 6 种 状态 ， 如 表 16-10 所 示 。 
表 16-10 “柴油 机 故障 模式 集 












正常 状态 

第 一 缸 喷 油 压 力 过 大 

第 一 缸 喷 油 压 力 过 小 

第 一 亿 喷 油 器 针 闻 磨 损 
油 路 堵塞 

供 油 提 前 角 提 前 5” ~ 6” 


在 某 类 型 柴油 机 上 分 别 测定 了 5 种 柴油 机 燃油 系统 典型 故障 状态 下 和 正常 状态 下 的 振 
动 参数 。 选 取 6 种 时 域 特征 参数 构成 神经 网 络 的 故障 征兆 输入 样本 集 ;: 能 量 指标 (E ) 、 
峭 度 指标 ( Kv ) 、 波 形 指标 ( S ) 、 裕 度 指标 ( L ) 、 脉 冲 指标 () 和 峰值 指标 ( C ) 。 

在 特定 的 工作 条 件 下 测量 时 域 特征 参数 ， 测 量 得 到 的 特征 参数 样本 如 表 16-11 所 示 。 
此 处 柴油 机 运行 的 工 况 条 件 为 ，900rpm， 空 载 。 其 中 每 种 状态 下 的 样本 1、2 对 应 测 点 为 
拓 盖 的 样本 ， 而 样本 3、4 则 是 测 点 为 缸 壁 的 样本 。 

















表 16-11 ”输入 样本 
峭 度 指标 KY | 波形 指标 S 峰值 指标 C 
10.4502 | 1.513 思 10.219 








12.4476 1.555 | on2ss 





263167 1.816 12.509 
33.6814 1.846 14.4085 
95332 16.7413 8.3052 























9.8209 18.3907 9.1336 













晴 度 指标 Kv 








裕 度 指标 上 


脉冲 指标 1 
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续 表 
峰值 指标 C 































































































157767 1.597 24.5548 18.505 11.5849 

样本 4 1.3905 13.3733 1.589 20.1439 15.154 9.5324 

状态 3 样本 1 0.7682 9.5489 1.497 76 11,497 7.68 

样本 2 | 0.7053 | 9.5317 1.508 14.3161 11.094 7.3552 
上 样本 3 2.2764 20.6665 1.634 图 | 26.848 20.214 12.3662 
样本 4 。 | 1.5686 17.3158 1627 22.1099 16.626 102175 

状态 4 样本 1 0.8116 8.1302 1.482 | 143D1 11.1105 7.4967 
样本 2 0.816 9.0388 | 1.497 15.0079 11.6242 7.7604 

样本 3 | 3.1503 30077 1719 ER 27.0329 15.719 
样本 4 。 | 43777 443974 | 173 42.8669 31.4872 18.1639 

















8.9071 





15.746 


| Does 











7.8909 











8.6747 





153114 


11.6297 








7.5984 











31.6339 








31.4159 


23.2644 








13.4654 











30.5401 








31.5176 





23.2395 


下 





13.3435 














8.3504 


1.51 12.8119 





9.8258 












6.506 











9.0865 





15.0798 





11.6764 








7.8209 














27.955 








| so 





25.7493 








15.1333 














20.9654 





33.4204 











24.0614 








13.9382 








解 (人 对 于 缸 盖 和 缸 壁 ， 需 要 建立 不 同 的 神经 网 络 ， 首先 建立 缸 盖 部 分 网 络 ， 定 义 输入 


样本 向 


P11=[1. 
P12=[1. 
P21=[1. 
P22=[1. 
P31=[0. 
P32=[0. 
P41=[0. 
P42= [0. 
P51=[1. 
P52=[1. 
P61=[1. 
P62=[1. 
P=[P11 





1803 
2016 
0970 
2340 
7682 
7053 
8116 
8160 
4311 
4136 
0167 
3392 


。 输 入 命令 : 


10.4502 1.5134 20.0887 15.4658 10.2193]'); 
12.4476 1.5556 20.6162 15.7558 10.1285]'; 


9. 
9。 
9。 


5332 
8209 
5489 


9.5317 
8.1302 
9.0388 
8. 
8 
8 


0971 


.6747 
.3504 
9. 


0865 


P12 P21 P22 


1.5341 
1.5316 
1.4970 
1.5083 
1.4820 
zx 
和 
1 
1 
1 


4979 


.5219 
.5305 
-5103 
.4930 


16. 
18. 
14. 
14. 
14. 
-0079 
-7460 
15. 
12. 
5 


15 
15 


7413 
3907 
7612 
3161 
3171 


3114 
8119 
0798 


12.7410 
13.9889 9.1336]' 
11.4973 7.6800]' 


8.3052]' 
9 
7 
11.0941 7.3552]' 
7 
7 





11.1105 7.4967]' 
11.6242 7.76041]'; 
12.0088 7.8909]'7 
11.6297 7.5984] 7 
9.8258 6.5060]' 
11.6764 7.8209]' 


P31 P32 P41 P42 P51 P52 P61 P62]); 


以 上 则 完成 了 输入 样本 向 量 书 的 定义 。 
全 对 故障 类 型 进行 编码 ， 如 表 16-12 所 示 。 
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表 16-12 ”故障 类 型 编码 表 









































编号 4 故障 类 型 输出 向量 
正常 状态 (1100000) 
第 一 缸 喷 油 压 力 过 大 (010000) 
第 一 缸 喷 油 压 力 过 小 1001000) 
第 一 缸 喷 油 器 针 闽 摩 损 (000100) 
油 路 墙 塞 [ooooioi 
供 油 提前 角 提 前 5"~6” 1000001) 





期 望 输 出 为 6 维 向 量 ， 其 中 故障 类 型 位 为 1 则 代表 发 生 了 相应 的 故障 。 接 下 来 定义 期 
望 输出 向 量 。 输 入 命令 : 


tll=-[L000001' 
tl2=[L 00000]' 
tc21=[010000]'; 
t22=[010000' 
t31=[001000]' 
t32=-[0 01000] 
t41=[0 00100]' 
c42=[0 00100]' 
tsl=-[00001 0 
t52=[0 00010]' 
t6l-[000001] 
t62=-[0 00001]' 
t=[tll tl12 t21 t22 t31 t32 t41 t42 t51 52 t61 t62]， 

从 而 完成 了 期 望 输出 向 量 的 定义 。 


合 仍旧 采用 BP 神经 网 络 进行 故障 诊断 ， 此 处 定义 BP 网 络 参数 如 表 16-13 所 示 。 


表 16-13”BP 神经 网 络 参数 设 定 








定义 BP 神经 网 络 ， 应 用 输入 、 输 出 样本 向 量 ， 设 定 误差 目标 为 le-4， 对 网 络 进行 训 
练 。 输 入 命令 


met=newff (minmax(P),[16,6],{'1ogsig'， "purelin'})，'trainlm') 

net ,trainParam.show = 100， 

net .上 trainParam.epoch = 2000， 

net .trainParam.goal= le-4， 

[net,tr]=train(net,P， 上 ) ， 

执行 上 述 命令 ， 在 弹出 的 nntraintool 窗口 中 单 击 “Performance” 按 钮 ， 绘 出 图 形 如 图 
16-6 所 示 。 可 以 看 到 经 过 17 次 迭代 网 络 就 达到 了 期 望 误差 目标 。 

夺 定义 验证 样本 ， 对 网 络 进行 验证 。 验 证 样本 如 表 16-14 所 示 。 
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图 16-6 ”和 缸 盖 样本 训练 过 程 中 的 误差 变化 曲线 


表 16-14 ”人 缸 盖 验 证 样本 表 








15.5814 





18.219 13.851 





13.598 10.5171 





14.4547 11.1971 





15.2558 11.5643 








输入 命令 ， 

ptest1l = [1. 
Ptest2 = [1 
ptest3 = [0 
ptest4 = [0. 


ptest5 = [1 
ptest6 = [1. 








14.9174 10.7511 











1833 11.8189 1.5481 20.2626 15.5814 10.0646]' 


-2394 9.6018 1.5366 18.219 13.851 9.0142] 
.661 8.8735 1.508 13.598 10.5171 6.9744] 7; 


7854 8.7568 1.4915 14.4547 11.1971 7.5071]'; 


.2448 8.3654 1.5413 15.2558 11.5643 7.503]'; 


3111 7.9501 1.4915 14.9174 10.7511 7.7127]'; 


Ptest =[ptest1l ptest2 ptest3 ptest4 ptest5 ptest6 ]); 


result_test 


输出 结果 为 : 


result_cest 
0.8489 
-0.0507 
-0.0174 
0.0116 
0.1108 
0.1342 


= sim(net，Pptest) 


0.1729 0.0363 -0.0514 -0.0336 “0.0233 
1.1214 0.0442 -0.0717 0.0443 -0.0963 
0.1247 “ 1.1754 -0.2465 -0.0197 “ -0.0088 
-0.0387 0.3135 0.7000 -0.0457 0.0627 
0.3473 -0.3028 ”0.1217 “1.2417 -0.3407 
-0.3634 -0.3704 0.2865 0.3034 0.9778 


将 结果 绘 成 表格 ， 如 表 16-15 所 示 。 
可 见 ， 训 练 后 的 网 络 诊断 结果 是 正确 的 。 需 要 指出 的 是 ,运用 BP 网 络 进行 故障 诊断 ， 
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除了 每 次 运行 时 都 具有 一 定 的 随机 性 之 外 ， 选择 的 神经 元 的 数目 也 会 影响 网 络 的 诊断 性 
能 ， 如 神经 网 络 隐 层 中 采用 13 个 神经 元 ， 一 次 训练 后 得 到 的 诊断 结果 如 表 16-16 所 示 。 





表 16-15 ”诊断 结果 1 





实际 故障 类 型 
类 型 1 




















实际 故障 类 型 
类 型 1 






































可 以 看 到 , 隐 层 含 13 个 神经 元 的 BP 神经 网 络 将 故障 类 型 6 的 样本 错误 判决 为 故障 类 
型 3， 有 兴趣 的 读者 可 以 自行 修改 程序 参数 ， 并 运行 查看 网 络 诊断 性 能 。 

全 对 于 缸 壁 数据 ， 采 用 同样 的 方法 重新 运行 程序 。 训练 过 程 中 的 误差 变化 曲线 如 图 
16-7 所 示 。 








图 16-7 ”所 壁 样本 训练 过 程 中 的 误差 变化 曲线 


采用 表 16-17 的 验证 样本 集 对 网 络 进行 验证 。 
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表 16-17 ”和 缸 壁 验证 样本 集 















































E K S L C 
样本 1 2.6917 25.9008 1.8263 30.7798 21.721 11.893 
样本 2 1.2558 12.2466 1.5869 19.3771 14.6 9.2006 
样本 3 1.8559 18.3491 1.628 24.1876 18.164 11.157 
样本 4 3.6823 37713 1.7639 39.8645 31.393 16.493 
样本 5 27157 2935636 1.7245 307679 22.812 13.228 
样本 6 3.2728 24.5571 1.7577 32.1747 23.226 14.214 
最 终 得 到 的 诊断 结果 如 表 16-18 所 示 。 



















表 16-18 ”诊断 结果 
实际 故障 类 型 诊断 数据 诊断 状态 
类 型 1 105 0.04 040 ] -oo 033 -0465 类 型 1 
类 型 2 1: -001 -0.02 类 型 2 












类 型 3 


























可 见 ， 训 练 后 的 网 络 同样 可 以 正确 地 进行 缸 壁 的 故障 诊断 。 


基于 神经 网 络 的 水 循环 系统 故障 诊断 


16.5.1 “问题 背景 


水 循环 系统 是 锅炉 系统 中 的 一 个 控制 单元 ， 用 于 对 锅炉 的 用 水 供给 和 冷却 ， 其 组 成 结 
构 如 图 16-8 所 示 。 


区 证 村 一 气体 


Le 


图 16-8 ”水 循环 冷却 系统 结构 


如 图 16-8 所 示 , 贮 存在 沉淀 水 池 中 的 水 ,经 过 过 滤器 将 杂质 过 滤 后 送 入 离心 泵 的 入 口 ， 
流 经 泵 体 进行 循环 ， 离 心 泵 则 由 电机 进行 驱动 。 
水 循环 冷却 系统 的 工作 流程 是 冷却 水 经 离心 泵 加 压 后 流 至 喷 淋 塔 顶部 的 喷 淋 头 ， 喷 淋 
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头 在 此 与 自 下 而 上 的 冷却 气体 进入 热 交 换 。 冷 却 水 经 换 热 后 温度 升 高 ， 在 塔 内 积存 起 来 ， 
并 保持 一 定 液 位 ， 防 止 气体 途 出 。 塔 底 的 排水 管 排出 的 冷却 水 进入 凉水 塔 ， 在 凉水 塔 中 冷 
却 水 由 风扇 鼓 出 的 风 进 行 冷却 后 ， 回 到 沉淀 池 ， 整 个 水 循环 一 周 。 

对 于 以 上 水 循环 系统 构建 一 个 故障 诊断 模块 ， 自 动 地 从 该 系统 当前 工艺 参数 中 辨别 和 
判断 故障 ， 既 可 避免 控制 人 员 对 大 量 工艺 参数 进行 检测 ， 又 可 以 使 控制 人 员 更 全 面 地 判断 
当前 生产 状态 和 预测 将 来 的 情况 ， 从 而 及 时 采取 有 效应 对 措施 。 水 循环 系统 的 故障 诊断 对 
于 现场 控制 人 员 来 说 是 非常 有 用 的 。 

BP 网 络 虽 然 可 以 以 任意 的 精度 逼近 任何 的 非 线性 函数 , 但 是 BP 神经 网 络 存在 一 些 缺 
陷 ， 

( 1 ) 难以 确定 网 络 结构 ， 需 要 通过 多 次 试验 进行 优化 和 选取 。 

(2 ) 存在 局 部 极 小 点 ， 无 法 保证 网 络 最 终 收 侣 于 全 局 最 小 点 。 

( 3 ) 收敛 速度 慢 。 对 于 非 线性 网 络 ， 采 用 基于 梯度 的 学 习 算法 时 ， 网 络 可 能 出 现 麻 闻 
现象 ， 使 网 络 的 收敛 速度 变 得 非常 缓慢 。 

( 4 ) 由 于 非 线性 网 络 存在 局 部 极 小 点 ， 权 值 的 初始 值 可 能 会 影响 到 网 络 最 终 的 收 笋 
性 ， 实 际 应 用 中 ， 通 常 采 用 给 网 络 权 值 赋 以 小 随机 数 的 方法 。 

而 RBF 网 络 在 以 上 这 些 方面 相对 于 BP 网 络 都 有 改善 。 此 例 中 应 用 RBF 径 向 基 网 络 
对 此 系统 进行 故障 诊断 。 





16.5.2 ”问题 实例 


【 例 16-4】 “水 循环 系统 故障 诊断 实例 。 通 过 传感器 采集 的 实验 数据 ， 建 立 锅炉 水 循 
环 系统 故障 诊断 神经 网 络 ， 运 用 该 神经 网 络 进行 水 循环 系统 的 故障 诊断 。 水 循环 系统 故障 
类 型 集 包 含 为 3 种 状态 ， 其 编码 如 表 16-19 所 示 。 


表 16-19 “水 循环 系统 故障 类 型 集 
















采集 参数 包括 检测 点 的 进口 压力 ( XI1 ) 、 出 口 压力 ( X2 ) 、 出 流量 ( X3 ) 、 轴承 温 
度 ( X4 ) ， 及 电机 电流 ( X5 ) ， 以 此 实验 数据 加 故障 类 型 编码 向 量 构成 输入 样本 ， 如 表 
16-20 所 示 。 此 数据 存 于 Excel 文件 16_5_P.xls 中 。 


表 16-20 ”输入 样本 



































进口 压力 C(X1) 轴承 温度 (X4》 | 电机 电流 〈X5) 
1 系 体 堵塞 。 | 0.83 0466 | om 078 076 
2 系 体 培 春 。 | 083 0466 | oss 08 076 
系 体 培 塞 0.83 0.55 08 076 
4 1 04 0.82 0.78 
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续 表 

号 故障 类 型 进口 压力 (X1》 | 出 口 压力 (X2)》 | 出 流量 (X3) 轴承 温度 〈X4) | 电机 电流 (X5) 

双 体 堵塞 0.66 03 0.6 0.82 078 

机 械 故 障 0.83 0.84 1 0.95 0.88 

机 械 故 障 0.83 0.84 1 098 093 

机 械 故 障 1 078 092 1 09 

机 械 故 障 0.66 0466 0.83 | 098 0.98 

机 械 故 障 | 083 0.62 0.85 0.98 1 

管道 桔 塞 05 | os 0.82 076 

管道 堵塞 02 0.66 084 0.78 

管道 堵塞 0.66 095 0.85 0.79 

管道 堵塞 0.66 

管道 堵塞 0.66 


























解 : 人 @ 定义 输入 样本 向 量 。 输 入 如 下 命令 ， 


[filename，pathname] = uigetfile('16_5_P.xls'); 
file=[pathname filename]; 
X=XlSread(file) 





P=P' 


人 @@ 定义 期 望 输出 向 量 ， 其 中 3 种 故障 类 型 的 编码 格式 如 表 16-19 所 示 。 在 MATLAB 


命令 空间 中 输入 命令 
tl=[1 0 0]， 
t2=[0 1 0]， 
t3=[0 0 1]， 
t= (tltltltltlt2t2t2t2t2t3t3t3t3t3); 


合 构建 神经 网 络 ， 此 处 采用 径 向 基 神 经 网 络 进行 故障 诊断 。 输 入 命令 ， 


Spread = 0.6); 
net = newrbe(p,t,spread) 


网 络 选用 的 散布 常数 值 设 定 为 0.6。 
人 鲜 应 用 验证 样本 对 此 网 络 进行 仿真 测试 ， 一 共有 6 个 测试 样本 ， 其 定义 如 表 16-21 


所 示 ， 这 些 数 据 存 于 Excel 文件 16_5_Ptest 文件 中 。 


表 16-21 测试 样本 





























序 “ 事 故障 类 型 ”| 进口 压力 (X1) | 出 口 压力 (X2) 轴承 温度 〈(X4) | 电机 电流 (X5) 
| 友 体 墙 塞 。 | 08 060 082 0.82 075 
| : 么 体 堵塞 。 | 091 040 | o7 087 
| 3 机 械 故 障 。 | 064 030 | os 08 

4 机 械 故 障 。 | 06 084 | os 098 

5 管道 堵塞 。 | 08 08 092 1 

6 管道 堵塞 09 077 0.1 095 
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输入 命令 : 


[filename，pathname] = uigetfile('16_5_Ptest .xls') 1 
file=[pathname filename]; 

xtesc=xlsread(file) 7 

ptest=xtest; 

ptest=ptest' 7 

ans = sim(net，Pptest)， 


输出 结果 为 : 


ans = 
1.1558 1.2558 “0.1618 ”0.2195 -0.5328 0.1057 
-0.2332 “ -0.2197 0.4694 0.6702 0.7886 0.1362 
0.1773 0.0639 0.4688 ”0.2103 ”0.8443 ”0.8580 


将 预测 结果 列表 ， 如 表 16-22 所 示 。 
表 16-22 ”测试 样本 



































可 以 看 到 ， 上 述 构造 的 RBF 神经 网 络 能 够 用 于 此 锅炉 水 循环 系统 的 故障 诊断 。 需 要 
说 明 的 是 ， 散布 常数 是 一 个 可 调 的 值 , 对 于 不 同 的 散布 常数 ， 生成 的 网 络 性 能 是 不 一 样 的 。 
上 面 的 散布 常数 0.6 是 经 过 尝试 之 后 确定 的 值 。 


本 章 首先 概述 了 神经 网 络 在 故障 诊断 中 的 应 用 ， 然 后 结合 4 个 大 例子 ， 综 合 讲述 了 
MATLAB 在 神经 网 络 故障 诊断 中 的 应 用 。 
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预测 是 人 们 根据 事物 的 发 展 规律 、 历 史 和 现状 ， 分 析 影 响 其 变化 的 因素 ， 对 其 发 展 前 
景 和 趋势 预先 进行 的 一 种 推测 。 

对 于 现实 中 大 量 存在 的 非 线性 、 非 平稳 的 复杂 动力 系统 问题 ， 非 线性 ARMA 模型 应 
用 中 需要 确定 合适 的 模型 阶 数 , 这 是 比较 困难 的 , 在 传统 的 预测 方法 解决 效果 欠 佳 的 领域 ， 
应 用 神经 网 络 等 智能 预测 方法 往往 能 够 更 有 效 。 

本 章 将 对 神经 网 络 在 不 同 领域 内 的 预测 应 用 通过 实例 进行 说 明和 介绍 ， 主 要 内 容 包括 
以 下 几 部 分 。 

( 1 ) 神经 网 络 预测 概述 。 

( 2 ) 基于 神经 网 络 的 地 震 预测 。 

( 3 ) 基于 神经 网 络 的 人 口 预测 。 

(4 ) 基于 神经 网 络 的 电信 业务 量 预测 。 

(5 ) 基于 神经 网 络 的 股市 预测 。 

( 6 ) 基于 神经 网 络 的 公司 财务 风险 预测 。 


神经 网 络 预测 概述 


神经 网 络 中 单个 神经 元 具有 简单 的 能 够 反映 非 线性 本 质 特征 的 能 力 ， 通过 这 些 基本 的 
单元 自 组 织 复 合 ， 使 神经 网 络 能 够 重建 任意 的 非 线性 连续 函数 。 通 过 学 习 这 一 归纳 过 程 ， 
可 以 使 网 络 获得 序列 的 内 在 规律 ， 从 而 可 以 对 序列 的 变化 进行 预测 。 使 用 神经 网 络 方法 避 
免 了 烦琐 的 常规 建 模 过 程 ， 而 且 神经 网 络 模型 有 良好 的 自 适 应 和 自学 习 能 力 、 较 强 的 抗 干 
扰 能 力 ， 易 于 给 出 工程 上 容易 实现 的 算法 。 用 于 预测 领域 的 神经 网 络 通常 有 ，BP 神经 网 
络 、 径 向 基 函 数 神经 网 络 、Elman 神经 网 络 等 。 

神经 网 络 应 用 于 预测 ， 大 体 可 以 分 为 两 种 方式 。 


1 基于 回归 分 析 的 神经 网 络 预测 

回归 分 析 预 测 法 是 利用 因素 之 间 的 因果 关系 ， 通 过 建立 回归 网 络 进行 预测 。 该 方法 具 
有 使 用 方便 、 能 进行 长 期 预测 ， 以 及 预测 精度 较 高 的 特点 。 

基于 回归 分 析 的 神经 网 络 预测 方法 的 步骤 如 下 。 

全 分 析 变 量 的 影响 因素 ， 并 确定 出 主要 因素 及 其 影响 程度 。 

人 @ 利用 历史 数据 建立 预测 变量 与 主要 影响 因素 之 间 的 回归 预测 网 络 。 

人 鲜 把 预测 期 各 主要 影响 因素 的 指标 值 ， 代 入 网 络 进行 预测 。 
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2. 基于 时 间 序 列 的 神经 网 络 预测 

基于 时 间 序 列 的 神经 网 络 预测 模型 的 建 模 过 程 与 基于 回归 分 析 的 建 模 过 程 基本 相同 
只 是 不 需要 确定 影响 因素 ， 因 此 在 对 输入 神经 元 的 确定 上 也 有 所 不 同 。 

在 样本 数据 确定 的 情况 下 ， 输 入 神经 元 的 数目 过 多 ， 则 供 网 络 训练 的 学 习 样 本 太 少 
反之 ， 输 入 神经 元 的 数目 过 少 ， 则 学 习 样本 太 多 。 该 方法 的 优点 是 没有 复杂 的 理论 问题 ， 
简便 易 行 ， 但 是 缺少 理论 依据 。 

自从 1987 年 Fabrer 首先 应 用 神经 网 络 进行 预测 以 来 ， 基于 神经 网 络 的 时 间 序 列 预 测 
方法 受到 重视 。 目 前 ， 已 有 多 种 不 同形 式 的 神经 网 络 被 用 于 工业 、 经 济 等 的 预测 中 。 研 究 
结果 表明 ， 神 经 网 络 用 于 预测 的 效果 较 好 ， 为 一 类 高 度 非 线性 动态 关系 的 时 间 序列 预测 提 
供 了 一 条 有 效 途径 。 

可 以 利用 已 知 数据 建立 一 系列 准则 用 于 预测 。 我 们 假设 一 次 观测 中 过 去 值 与 未 来 值 之 
间 存 在 联系 ， 找 到 一 个 函数 ， 当 过 去 观测 值 作为 输入 时 ， 给 出 未 来 值 作为 输出 ， 这 个 模型 
是 由 神经 网 络 来 实现 的 。 

相对 传统 的 统计 预测 方法 而 言 ， 神 经 网 络 模型 有 良好 的 非 线性 品质 、 灵 活 而 有 效 的 学 
习 方式 ， 以 及 完全 分 布 式 的 存储 结构 。 

在 时 间 序列 预测 中 ， 前 馈 网 络 是 最 常 使 用 的 网 络 。 在 这 种 情形 下 ， 从 数学 角度 看 ， 网 
络 成 为 非 线 性 函数 。 记 一 个 时 间 序列 为 LX} ， 对 其 进行 预测 可 用 下 式 描述 ; 


nk = 了 (Xn, Xi Xman 


时 间 序列 预测 方法 即 用 神经 网 络 来 拟 合 函数 fj， 然后 预测 未 来 值 。 这 就 是 利用 神经 网 
络 进行 时 间 序 列 预 测 的 基本 思路 。 

一 般 将 外 生变 量 样本 观察 值 或 时 间 序列 数据 作为 网 络 的 输入 向 量 ， 将 内 生变 量 样本 值 
作为 输出 ， 通 过 训练 网 络 ， 可 以 预测 内 生变 量 的 下 一 步 走向 。 无 论 系统 模型 是 何 种 类 型 ， 
用 于 表述 这 些 神经 网 络 的 框架 结构 是 不 变 的 。 

尽管 神经 网 络 也 存在 一 些 不 足 ， 比 如 缺乏 统计 合理 性 ， 不 易 解释 ， 缺 乏 稳健 性 ， 运 算 
速度 慢 ， 隐 层 节点 数 依赖 经 验 等 ， 但 它 突破 了 传统 预测 方法 的 许多 局 限 性 ， 在 实践 中 有 着 
较为 广泛 的 应 用 ， 是 一 种 很 有 前 景 的 预测 方法 。 

利用 神经 网 络 进行 预测 ， 首 先 要 对 系统 建 模 。 系统 建 模 通常 有 两 种 方式 ， 正 向 建 模 和 
逆向 建 模 。 


1. 正 向 建 模 

正 向 建 模 是 指 训练 一 个 神经 网 络 表达 系统 正 向 动态 的 过 程 ， 这 一 过 程 建立 的 神经 网 络 
模型 称 为 正 向 模型 ， 其 结构 如 图 17-1 所 示 。 其 中 神经 网 络 与 待 闪 识 系统 并 联 ， 两 者 输出 的 
误差 作为 网 络 的 训练 信号 。 显 然 ， 这 是 一 个 典型 的 有 监督 学 习 过 程 ， 实际 系统 作为 导师 ， 
向 神经 网 络 提供 训练 算法 所 需 的 期 望 输出 。 

比如 建 模 系统 为 被 控 对 象 时 ， 神经 网 络 多 采用 多 层 前 向 网 络 ， 可 直接 选择 误差 反 向 传 
播 算法 或 其 变形 ， 这 时 神经 网 络 代替 被 控 对 象 ， 用 来 提供 控制 误差 的 反 向 传播 通道 ， 或 直 
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接替 代 传统 控制 器 ， 如 PID 控制 器 等 。 而 当 系统 为 性 能 评价 器 时 ， 可 选择 再 励 学 习 算法 。 
这 里 的 网 络 既 可 以 采用 有 全 局 和 逼 近 能 力 的 神经 网 络 ， 如 多 层 感知 器 ， 也 可 以 选用 有 局 部 逼 
近 能 力 的 神经 网 络 ， 如 小 脑 模型 关节 控制 器 ( CMAC ) 等 。 


了 村 











图 17-1 正 向 建 模 


2， 逆 向 建 模 
逆向 建 模 又 分 为 直接 逆 建 模 和 正 - 逆 建 模 ， 其 中 ， 直 接 逆 建 模 的 结构 如 图 17-2 所 示 。 


一 动态 系统 2 











图 17-2 直接 逆 建 模 


直接 逆 建 模 也 称 为 广义 逆 学 习 ( Generalized Inverse Leaming )， 从 原理 上 来 说 是 一 种 
简单 的 方法 。 从 图 中 可 以 看 出 ， 待 辨识 系统 的 输出 作为 网 络 的 输入 ， 网 络 输出 与 系统 输入 
比较 ， 相 应 的 输入 误差 用 来 进行 训练 ， 因 而 网 络 将 通过 学 习 建立 系统 的 逆 模型 。 但 是 如 果 
所 辨识 的 非 线性 系统 是 不 可 逆 的 ， 利 用 上 述 方法 ， 可 能 得 不 到 一 个 正确 的 逆 模型 。 因 此 ， 
在 建立 系统 的 逆 模 型 时 ， 必 须 事先 确定 系统 是 可 逆 的 。 

正 - 逆 建 模 也 称 为 狭义 逆 学 习 ( Specialized Inverse Learning ), 其 结构 如 图 17-3 所 示 。 
这 时 待 扒 识 的 网 络 位 于 系统 之 前 ， 并 与 之 串联 。 网 络 的 输入 为 系统 的 期 望 输出 yx(D) ， 
训练 误差 为 期 望 输出 与 实际 输出 之 差 ， 或 为 期 望 输出 与 已 建立 的 神经 网 络 正 向 模型 给 
出 之 差 。 

此 方法 的 特点 是 ， 通 过 使 用 系统 已 知 的 正 向 动力 学 模型 ， 或 增加 使 用 已 建 模 的 神经 网 
络 正 向 模型 ， 以 避免 再 次 采用 系统 输入 作为 训练 误差 ， 使 待 辨识 的 网 络 仍然 沿 期 望 输出 进 
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行 学 习 ， 从 根本 上 克服 了 使 用 系统 输入 作为 训练 误差 所 带 来 的 问题 。 此 外 ， 对 于 不 可 道 的 
系统 ， 利 用 此 方法 也 可 以 得 到 一 个 具有 期 望 特性 的 特殊 逆 模型。 
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图 17-3” 正 - 逆 建 模 
基于 神经 网 络 的 地 震 预 测 


17.2.1， 问 题 背景 


地 震 的 发 生 会 给 社会 带 来 不 同 程度 的 破坏 ， 造 成 生命 、 财产 的 损失 。 目 前 地 震 学 只 是 
一 门 观测 科学 ， 人 们 只 能 加 强 观测 ， 通 过 各 种 经 验方 法 来 进行 预测 ， 确定 重点 监测 区 。 

地 震 预 测 是 对 未 来 破坏 性 地 震 发 生 的 时 间 、 地 点 和 震级 及 地 震 影响 的 预测 ， 是 根据 地 
区 地 质 、 地 震 活动 性 、 地 震 前 兆 异 常 和 环境 因素 等 多 种 手段 的 研究 与 前 兆 信息 监测 所 进行 
的 现代 减灾 科学 。 地 震 预测 技术 是 从 地 震 监测 、 大 震 考 察 、 野外 地 质 调 查 、 地 球 物理 勘探 、 
室内 实验 等 多 方面 对 地 震 发 生 的 条 件 、 规 律 、 前 兆 、 机 理 进行 预报 ， 并 研究 其 方法 及 对 策 
的 综合 技术 。 

由 于 地 震 学 指标 与 地 震 之 间 存 在 较 强 的 不 确定 性 , 通常 一 种 地 震 学 指标 在 一 次 地 震中 出 
现 ， 而 在 其 他 的 地 震中 不 出 现 或 不 明显 ， 因 此 ， 单一 使 用 某 一 个 地 震 学 指标 的 预测 方法 就 存 
在 局 限 性 。 而 如 何 解决 预测 结论 的 权 值 以 及 各 指标 组 合 时 相互 间 的 非 线性 联系 对 最 终 预测 结 
论 产生 影响 ,就 成 为 难题 ,神经 网 络 技术 的 发 展 给 我 们 提供 了 一 个 解决 这 个 问题 较 好 的 方法 。 

神经 网 络 相对 于 其 他 预测 手段 ， 具有 并 行 分 布 处 理 与 存储 、 高 度 容错 、 自 组 织 、 自 适 
应 和 自学 习 功能 ,能 分 析 较 为 复杂 的 非 线性 系统 。 它 通过 分 析 各 个 指标 ， 建 立 其 内 在 联系 ， 
并 根据 这 种 联系 对 目标 进行 预测 ， 能 有 效 地 和 避免 了 采用 单一 指标 进行 预测 的 片面 性 ， 大 大 
提高 了 预测 的 精度 。 

下 面 就 Biman 神经 网 络 算法 及 其 在 地 震 预 测 中 的 具体 运用 实例 进行 介绍 。 


17.2.2 ”问题 实例 


【 例 17-1】 “地 震 预测 实例 。 选 取 某 地 沿海 东经 117” ~120”， 北纬 22* -26”" 范围 内 
的 地 震 在 时 间 、 空 间 、 强度 三 方面 具有 代表 性 的 6 个 指标 : 频 度 、 蠕 变 、 能 量 、B 值 、 缺 
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震 、m 值 指标 的 29 组 数据 ( 如 表 17-1 所 示 ) 作为 网 络 的 输入 ， 利 用 神经 网 络 对 其 第 二 年 
可 能 发 生 的 地 震 最 大 震级 进行 预测 。 


表 17-1 地 震 样本 数据 




















































































































表 中 ， 前 6 列 为 学 习 样 本 中 的 输入 样本 ， 而 第 7 列 则 为 期 望 响 应 ， 是 这 一 地 区 第 二 年 


可 能 发 生 的 地 震 的 最 大 震级 。 
解 ; @@ 定义 期 望 样本 向 量 。 在 MATLAB 命令 空间 中 输入 命令 : 


【filename，Ppathname] = uigetfile('12_1_P.xls'); 
file=[pathname filename]; 
X=xlSsread(file): 

1) ,X 2),x(:,3),x(:，4),X(: 
t= X(:,7)'， 





5),x(:,6) 7 
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接着 定义 测试 样本 向 量 。 输 入 命令 : 


[filename，pathname] = uigetfile('12_1_PEest.xls')7 
file=[pathname filename]7 

x=xlSsread(file)7 

ptest=[x(:,1),x(:,2),x(:,3) ,xf(:,4),x(:,5),x(:，6)7] 
上 test=x(:,7) 


登 创建 ElIman 神经 网 络 ， 并 对 其 进行 训练 。Elman 神经 网 络 是 一 种 带 反 馈 的 两 层 神 
经 网 络 ， 反 馈 连 接 从 第 一 层 输 出 连接 到 输入 端 ， 此 反馈 连接 使 得 Eiman 网 络 能 够 检测 和 人生 
成 时 变 模式 。 输 入 命令 ， 

net=newelm(minmax(p), [25,1],{'"logsig'，'purelin'])， 

net .trainParam.show = 200， 

net ,trainParam.epoch = 3000， 


net .trainpParam.goal= le-2， 
[net ,trz]=train(net,Pp,c) 7 


此 Elman 网 络 结构 可 以 由 弹出 的 nntraintool 窗口 上 的 结构 图 看 出 ， 如 图 17-4 所 示 。 








从 图 中 可 以 看 到 ，Elman 网 络 的 隐 层 也 即 反馈 层 的 神经 元 采用 logsig 传递 函数 ， 而 输 
出 层 采 用 线性 传递 函数 。 网 络 误差 变化 如 图 17-5 所 示 ， 就 训练 情况 来 说 ,网络 实 际 上 并 没 
有 达到 le-2 的 误差 目标 ， 但 仍然 可 以 尝试 将 训练 后 的 网 络 应 用 于 预测 
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图 17-5 训练 过 程 中 网 络 误差 的 变化 
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合 训练 完毕 后 ， 首 先 将 所 有 样本 输入 网 络 ， 然 后 定义 检验 向 量 ， 并 将 检验 向 量 输入 
网 络 ， 查 看 输出 值 和 输出 误差 。 输 入 命令 : 


rtest = sim(net，Pp); 

rdaelta = rtest-t; 

result_test = sim(ner，ptest)7 
delta = result_cest-ttesti 


Fesult = [ttest' result_test' delta'] 

输出 结果 为 : 

result = 
4.9000 4.6375 “ -0.2625 
3.9000 3.9048 0.0048 
4.4000 4.0387 -0.3613 
5.5000 4.0645 -1.4355 
4.7000 “4.5633 -0.1367 
4.1000 4.4539 “0.3539 
5.1000 “ 4.4907 -0.6093 
4.3000 4.3753 ”0.0753 
4.6000 4.1862 -0.4138 


将 结果 显示 为 表格 ， 如 表 17-2 所 示 。 


表 17-2 ”期 望 输出 与 实际 输出 比较 






































可 以 看 到 ， 对 第 4 个 和 第 7 个 样本 ， 预 测 的 偏差 较 大 。 以 预测 震级 偏离 期 望 值 0.5 为 
标准 ， 则 此 Elman 网 络 的 预测 正确 率 为 77%。 

在 用 神经 网 络 进行 预测 时 ， 得 出 的 结果 体现 了 选 定 的 各 个 指标 的 “集体 ”智慧 ， 大 大 提 
高 了 预测 的 准确 度 。 但 从 神经 元 的 选取 、 层 面 的 确定 和 和 迭代 次 数 的 变化 等 因素 来 看 ， 神 经 网 络 
的 预测 效果 也 是 有 很 大 的 主观 随意 性 的 ， 神 经 网 络 模型 会 因 选取 的 输入 、 训 练 次 数 的 不 同 而 得 
出 不 同 的 结果 ， 这 也 反映 出 现 阶段 地 震 预 测 水 平 的 一 个 共性 ， 即 任何 预测 方法 都 带 有 局 限 性 。 

尤其 是 在 神经 网 络 方法 中 ， 一 方面 我 们 选用 这 些 地 震 学 指标 仅 是 地 震 活动 的 表象 的 指 
标 ， 而 不 是 目前 也 还 不 可 能 是 直接 反映 发 震 物理 实质 的 指标 ( 例如 震源 处 的 应 力 大 小 、 破 
裂 类 型 等 指标 )， 另 一 方面 ， 选 取 的 指标 之 间 还 很 难 满 足 输 入 元 相互 完全 的 “独立 性 ”要 
求 。 但 是 ， 由 于 神经 网 络 的 “自学 习 ” 过 程 能 较 好 地 调整 各 指标 对 地 震 预测 结果 的 权 值 ， 


本 古本 本 381 


精通 MATLAB 神经 网 络 
使 得 这 一 方法 能 够 得 到 较 理想 的 预测 效果 ， 不 失 为 一 种 可 选择 的 数学 模型 





加 切 基于 神经 网 络 的 人 口 预测 


17.3.1 “问题 背景 


世界 人 口 的 迅猛 增长 引发 了 许多 问题 。 特 别 是 一 些 经 济 不 发 达 国 家 的 人 口 过 度 增长 ， 
影响 了 整个 国家 的 经 济 发 展 、 社 会 安定 和 人 民生 活水 平 的 提高 , 给 世界 发 展 带 来 许多 问题 

为 了 解决 人 口 增长 过 快 的 问题 ， 人 类 必须 控制 人 口 的 增长 ， 使 之 与 社会 、 经 济 的 发 展 
相 适 应 ， 与 环境 、 资 源 相 协调 。 

人 口 预测 对 于 提供 准确 的 人 口 信息 ， 对 于 国家 制定 生育 政策 和 社会 发 展 计划 有 重要 的 
意义 。 目 前 国内 外 提出 了 很 多 种 预测 方法 和 预测 模型 ， 如 常 微分 方程 法 ， 动 态 预 测 法 ，AR 
方法 等 。 在 这 些 方法 中 ， 由 于 神经 网 络 方法 具有 识别 复杂 非 线性 系统 的 特性 ， 具 有 高 速 的 
自学 习 、 自 适应 能 力 ， 因 而 获得 了 较为 广泛 的 应 用 。 





17.3.2 ”问题 实例 


【 例 17-2】 人口 预 测 实 例 。 应 用 BP 神经 网 络 建立 时 间 序 列 人 口 预测 模型 ， 检 验 预 
测 效 果 ， 我 国 1994-2005 年 人 口 数 据 如 表 17-3 所 示 。 


表 17-3 ”1994-2005 年 人 口 数据 







人 数 〈 亿 ) 





11.9850 12.6743 





12.1121 12.7627 
12.2389 12.8453 
12.3626 12.9227 











12.4810 12.9905 





13.0756 


BP 神经 网 络 的 输入 层 、 隐 含 层 和 输出 层 节 点 数 取决 于 对 象 的 复杂 性 。 本 例 中 对 于 
1994-2002 年 的 数据 ， 选 择 前 3 年 的 数据 作为 序列 的 输入 样本 ， 下 一 年 数据 作为 网 络 的 输 
出 ;选用 2004、2005 年 的 数据 为 检验 样本 ， 如 表 17-4 所 示 。 





表 17-4 ”样本 选择 











































训练 样本 序号 输 输 出 
1 1994-1996 年 的 人 口 数 1997 年 的 人 口 数 
2 1995-1997 年 的 人 口 数 1998 年 的 人 口 数 
3 1996-1998 年 的 人 口 数 1999 年 的 人 口 数 
4 1997-1999 年 的 人 口 数 2000 年 的 人 口 数 
5 1998-2000 年 的 人 口 数 2001 年 的 人 口 数 
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续 表 
















训练 样本 序号 输 入 输出 
1999-2001 年 的 人 口 数 2002 年 的 人 口 数 
2000-2002 年 的 人 口 数 2003 年 的 人 口 数 
验证 样本 输入 输出 
1 2001-2003 年 的 人 口 数 


2002-2004 年 的 人 口 数 
























2004 年 的 人 口 数 
2005 年 的 人 口 数 














解 ， 人 @@ 定义 期 望 样本 向 量 。 在 MATLAB 命令 空间 中 输入 命令 : 


p0=[11.9850 12.1121 12.2389 12.3626 12.4810 12.5768... 
12.6743 12.7627 12.8453 12.9227 12.9905 13.0756]; 
for 工 






p(:,i)=[p0(i) poO(i+l) p0(i+2)] 7 
上 (i)=p0(i+3)7 

enad 

P 

七 

输出 为 : 


p =11.9850 12.1121 12.2389 12.3626 12.4810 12.5768 12.6743 
12.1121 12.2389 12.3626 12.4810 12.5768 12.6743 12.7627 
12.2389 12.3626 12.4810 12.5768 12.6743 12.7627 12.8453 

+ =12.3626 12.4810 12.5768 12.6743 12.7627 12.8453 12.9227 


全 构建 BP 网 络 ， 设 置 为 隐 层 神经 元 为 5 个 ， 输 出 层 神经 元 为 1 个 ， 并 利用 输入 样 
本 向 量 进行 训练 。 输 入 命令 : 


net=newftf (minmax(p),[5,1],{'1ogsig','purelin'}j,'crainlm') 
net .rainParam.show = 100， 

net .trainParam.epoch = 2000， 

net .ErainParam.goal= le-4， 

[net,tr]=train(net,p,t) 


训练 过 程 中 ， 网 络 误差 的 变化 情形 如 图 17-6 所 示 。 





图 17-6 ”训练 过 程 中 误差 的 变化 曲线 
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经 过 10 次 进 代 ， 网 络 达到 了 期 望 的 误差 目标 。 
合 训练 完毕 后 ， 首 先 将 所 有 样本 输入 网 络 ， 然 后 定义 检验 向 量 ， 并 将 检验 向 量 输入 
网 络 ， 查 看 输出 值 和 输出 误差 。 输 入 命令 : 


ptest(:,1)=[p0(8) p0(9) p0(10)] 7 
ptest{(:,2)=[p0(9) p0(10) p0(11)] 7 
ttest (1)=p0(11)7 

上 test (2)=p0(12) 7 

result_test = sim(net,p) 
result_testl = sim(net,pPtest) 
delta = result_test1-ttest 


输出 结果 为 


result_test =12.3738 12.4670 12.5891 12.6710 12.7588 12.8526 
12.9130 

result_testl = 12.9604 12.9891 

daelta = -0.0301 -0.0865 

可 以 看 到 ， 对 于 训练 样本 ， 网 络 输出 与 期 望 响应 符合 得 很 好 ， 检 验 样本 预测 值 误差 分 
别 为 -0.0301 和 -0.0865。 绘 图 显示 预测 曲线 与 真实 曲线 。 输 入 命令 : 


result = [result_test result_cest1]; 
plot([1997:2005],p0(4:12),'-+' [1997:2005]， result，'-go') 


绘 出 曲线 如 图 17-7 所 示 。 























2 





图 17-7 ”预测 曲线 与 真实 数据 


其 中 加 号 "+" 曲线 对 应 为 实际 数据 ,“o" 曲线 对 应 为 预测 数据 。 可 以 看 到 , 在 1997-2003 
年 之 间 两 条 曲线 符合 很 好 ， 这 是 在 期 望 目标 响应 之 下 监督 训练 的 结果 ， 而 这 之 后 预测 值 则 
逐渐 偏离 真实 值 ，2004-2005 年 的 预测 误差 有 逐渐 增 大 的 趋势 ， 但 是 误差 大 小 在 0.1 以 内 ， 
说 明 此 网 络 的 预测 精度 仍然 是 较 高 的 。 
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基于 神经 网 络 的 电信 业务 量 预 测 





17.4.1 问题 背景 


电信 业 是 国民 经 济 的 一 个 重要 组 成 部 分 。 电 信 业 务 量 是 表示 需要 传递 的 电信 信息 数 
量 ， 它 是 核算 设备 、 生 产 人 员 和 组 织 生产 的 主要 依据 。 

电信 业务 量 与 电信 业务 收入 在 以 货币 计量 的 数量 上 是 不 相等 的 ， 电 信 业 务 量 仅 要 计算 
计 趴 业务 部 分 ， 而 且 还 要 计算 免费 业务 部 分 。 因 为 免费 业务 只 是 没有 取 收入 ， 但 是 它 和 计 
费 业 务 一 样 具 有 使 用 价值 ， 电 信 企 业 需 要 为 免费 业务 提供 和 计 费 业务 相同 的 服务 。 因 此 ， 
电信 业务 量 更 能 完整 地 反映 电信 企业 的 业务 种 类 和 业务 量 。 

电信 业务 量 的 预测 ， 是 编制 电信 专业 网 络 规划 工程 可 行 性 研究 ， 乃 至 初步 设计 的 要 内 
容 ， 预 测 结果 是 否 符合 客观 实际 ， 能 否 正 确 反 映 未 来 的 发 展 趋势 ， 直 接 关系 拟 建 设 的 电信 
网 络 结构 、 工 程 规模 、 投 资 的 大 小 以 及 经 济 效益 的 好 坏 ， 因 此 是 一 项 重要 的 基建 工作 。 


17.4.2 ”问题 实例 


【 例 17-3】 ”电信 业务 量 预测 实例 。 应 用 BP 神经 网 络 进行 电信 业务 量 预测 ， 并 检验 
预测 效果 ， 我 国 1989-2005 年 电信 业务 量 如 表 17-5 所 示 。 


表 17-5 ”1989-2005 年 电信 业务 量 数据 



































年 ” 份 业务 量 〈 万 户 ) 年 ” 份 业务 量 〈 万 户 ) 
1989 12346 1998 | 243121 
1990 155.54 1999 3330.82 
1991 20438 2000 一 4792.70 
1992 29094 2001 | 4556.26 
1993 462.71 2002 | 5695 80 
1994 688.19 2003 7019.79 
1995 988.85 2004 9712.29 
1996 1342.04 2005 | 12028.54 
1997 177329 











BP 神经 网 络 的 输入 层 、 隐 含 层 和 输出 层 节点 数 取 决 于 对 象 的 复杂 性 。 这 里 对 于 
1994-2002 年 的 数据 ， 选 择 前 4 年 的 数据 作为 序列 的 输入 样本 ， 下 一 年 数据 作为 网 络 的 输 
出 ; 选用 2004、2005 年 的 数据 为 检验 样本 ， 如 表 17-6 所 示 。 


表 17-6 ”样本 数据 

























训练 样本 序号 输入 输 出 
1989-1992 年 的 业务 量 1993 年 的 业务 量 
1990-1993 年 的 业务 量 1994 年 的 业务 量 















1995 年 的 业务 量 





1991-1994 年 的 业务 量 
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续 表 

训练 样本 序号 输出 

4 1996 年 的 业务 量 

5 1993-1996 年 的 业务 重 1997 年 的 业务 量 

6 1994-1997 年 的 业务 量 1998 年 的 业务 量 

7 1995-1998 年 的 业务 量 1999 年 的 业务 量 

8 1996-1999 年 的 业务 量 2000 年 的 业务 量 

9 1997-2000 年 的 业务 重 2001 年 的 业务 量 

10 | 1998-2001 年 的 业务 量 2002 年 的 业务 量 

四 1999.2002 年 的 业务 量 | 2003 年 的 业务 量 
验证 样本 输入 输出 

1 2000.2003 年 的 业务 重 | 2004 年 的 业务 量 

2 2001-2004 年 的 业务 量 2005 年 的 业务 量 





解 ， 全 定义 训练 样本 向 量 。 在 MATLAB 命令 空间 中 输入 命令 ， 


po =-[123.46 155.54 204.38 290.94 462.71 688.19 988.85 1342.04 
1773.29 2431.21 3330.82 4792.7 4556.26 5695.8 7019.79 9712.29 12028.54] 7 


由 于 输入 向 量 中 的 数据 元 素 变动 范围 很 大 ， 所 以 这 里 首先 将 其 进行 归 一 化 处 理 ， 将 其 
转化 为 [0,1]] 区 间 的 实数 。 输 入 命令 : 

ac=max(PO) 1 

b=min(p0) ; 

for i=1:17 

poti) = (p0(i) -bl/(a-b); 

enad 


以 上 完成 了 输入 向 量 的 归 一 化 处 理 ， 下 面 对 输 入 向 量 进行 定义 。 输 入 命令 : 


for 1 = 1:11 
p(:,i)=[p0(i) p0(i+l) p0(i+2) p0(i+3)] 7 
t(i) = p0O(i+4) 7 

ena 


完成 训练 样本 向 量 定义 。 

全 构建 BP 神经 网 络 , 设置 网 络 隐 层 神经 元 数目 为 11 个 ， 并 应 用 样本 向 量 进 行 训练 。 
输入 命令 : 

net=newff (minmax(p),[11,1],{'logsig'，'purelin')，Erainlm') 

net .trainParam.show = 100， 

net .trainParam-epoch = 2000， 


net .trainParam.goal= 1e-4， 
[net,tr]=train(net, pt) 7 


网 络 经 过 3 次 迭代 就 完成 训练 ， 其 误差 达到 误差 目标 以 下 。 训 练 过 程 中 网 络 误差 如 图 
17-8 所 示 。 
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图 17-8 ”预测 曲线 与 真实 数据 
全 定义 测试 样本 向 量 。 输 入 命令 ， 


ptest(:,1)=[p0(12) p0(13) p0(14) p0(15)] 7 
Ptest(:,2)=[p0(13) p0(14) p0(15) p0(16)] 7 
ttest (1)=p0(16); 
ttest (2)=p0(17)7 


八 对 网 络 进行 仿真 ， 并 将 期 望 输出 、 预测 结果 以 及 预测 误差 组 合 输出 。 输 入 下 列 
命令 


result_~test = sim(net,p) 

result_test1 =- sim(net,ptest) 

result = [result_test result_testl]) 

ttest2 = [t ttest]; 

result2 = [ttest2，result' (result-ctest2) '] 


输出 结果 为 ， 


result2 = 
0.0285 0.0334 0.0049 0.1709 
0.0474 0.0509 0.0034 0.0723 
0.0727 0.0721 -0.0006 -0.0085 
0.1024 0.1039 0.0016 0.0154 
0.1386 0.1425 0.0040 0.0286 
0.1938 0.1943 0.0005 0.0025 
0.2694 0.2667 -0.0028 -0.0102 
0.3922 0.3797 -0.0125 -0.0319 
0.3723 0.3662 -0.0062 -0.0165 
0.4681 0.4693 0.0013 0.0027 
0.5793 “0.5797 “0.0004 ”0.0007 
0.8054 0.8430 0.0376 0.0467 
1.0000 1.2498 0.2498 0.2498 


其 中 ， 第 一 列 为 期 望 输出 ， 第 二 列 为 实际 输出 ， 第 三 列 为 绝对 预测 误差 ， 第 四 列 为 相 
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对 预测 误差 。 除 最 后 两 行为 检测 样本 外 ， 其 余 均 为 训练 样本 及 其 预测 输出 值 。 可 以 看 到 ， 
对 于 训练 样本 向 量 ， 除 第 一 个 样本 向 量 之 外 ， 其 余 相 对 预测 误差 均 在 8% 以 下 。 

对 于 最 后 两 个 检验 样本 ， 可 以 看 到 ， 第 一 个 检测 样本 相对 预测 误差 为 4.67% ， 而 第 二 
个 样本 误差 则 大 大 增加 ， 达 到 了 24.98%; 这 说 明 ,该 网 络 进行 外 推 计算 第 一 步 是 比较 准确 
的 ， 但 是 第 二 步 预测 就 不 够 准确 了 。 

下 面 对 结果 进行 绘图 显示 ， 输 入 下 列 命令 


plot([1993:2005],p0(5:17)，'-r*' [1993:2005],result， '-o0) 


绘 出 曲线 如 图 17-9 所 示 。 
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基于 神经 网 络 的 股市 预测 


17.5.1 “问题 背景 


股票 市 场 是 国民 经 济 的 “晴雨 表 ” 和 “报警 器 "， 它 不 仅 被 政府 所 重视 ， 更 受到 广大 
投资 者 的 关注 。 

神经 网 络 可 以 通过 学 习 掌握 数据 之 间 的 依存 关系 ， 进 行 股市 预测 。 与 以 往 的 传统 方法 
相 比 ， 这 种 方法 具有 很 大 的 优越 性 。 股 价 走势 呈 高 度 非 线性 ， 并 且 成 交 价 、 成 交 量 中 包含 
有 大 量 决定 股价 变动 的 内 在 规律 和 特点 ， 通 过 对 历史 交易 数据 的 学 习 ， 神 经 网 络 能 够 从 复 
杂 的 数据 中 技 出 参数 之 间 的 规律 。 神 经 网 络 是 通过 反复 对 照 观测 样本 ， 逐 步 逼近 理想 的 结 
果 的 。 一 个 以 线性 函数 作为 转换 函数 的 前 向 二 层 神经 网 络 相当 于 一 个 线性 回归 模型 ， 当 转 
换 函 数 为 非 线性 时 ， 一 个 前 向 多 层 网 络 相当 于 一 个 复杂 的 非 线性 回归 模型 。 

对 于 非 线性 回归 问题 ， 人 们 通常 用 变量 的 变换 转化 为 线性 回归 问题 。 这 种 变换 依赖 于 
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建 模 者 的 观察 和 经 验 ， 在 模型 涉及 多 个 自 变量 时 ， 要 找到 恰当 的 变换 并 不 容易 ， 而 神经 网 
络 通过 自我 学 习 过 程 寻找 变量 之 间 的 规律 ， 具 有 很 强 的 适应 能 力 。 同 时 它 也 不 像 线性 回归 
那样 对 误差 项 的 统计 分 布 有 严格 的 要 求 ， 还 可 以 处 理 不 完全 的 数据 。 


17.5.2 ”问题 实例 





【 例 17-4】 ”股市 预测 实例 。 选 择 2000 年 某 一 时 段 每 日 股市 收盘 价 作为 样本 ， 应 用 
BP 神经 网 络 对 其 进行 时 间 序 列 预测 。 基 于 大 多 数 的 股票 交易 者 都 是 中 线 或 者 长 线 持 有 股 
票 以 获取 最 大 的 利润 这 一 事实 ， 此 处 主要 进行 中 期 预测 的 研究 。 将 股票 收盘 价 数据 按 周 取 
平均 值 ， 得 到 该 周 的 平均 收盘 价 ， 如 表 17-7 所 示 。 





















































































表 17-7 ”样本 数据 
了 1258.02 1651.22 
2 1267.43 17 1713.81 
3 1294.54 18 1708.22 
4 1298.66 19 1666.55 
5 1334.43 20 1675.05 
6 1354.66 21 1597.08 
世 1392.62 22 1583.72 
8 1416.8 1597.37 
章 1542.83 1614.59 
上 10 1635.86 25 1650.4 
1 1611.7 26 1664.58 
12 1660.15 1694.19 
13 1619.23 1733.39 
14 1548.22 
1595.7 















解 : (@@ 定义 训练 样本 向 量 。 在 MATLAB 命令 空间 中 输入 命令 : 


p0=[1258.02 1267.43 1294.54 1298.66 1334.43 1354.66 1392.62 1416.8 1542.83 .,. 
1635.86 1611.7 1660.15 1619.23 1548.22 1595.7 1651.22 1713.81 1708.22... 
1666.55 1675.05 1597.08 1583.72 1597.37 1614.59 1650.4 1664.58 1694.19... 
1733.39 1731.1]; 

a=max(p0) 17 

b=min(p0) 

for i=1:29 
p0(i)={(pP0(i)-b)/(a-b); 

end 

for i = 1:22 
p(:,i)=[p0(i); p0(i+l); p0(i+2); p0O(i+3)]7 
t(i) = pO(i+4)7 

end 
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于 是 训练 样本 向 量 定义 完毕 。 

例 构建 BP 神经 网 络 ， 设 置 网 络 隐 层 神经 元 数目 为 12 个 ， 接 下 来 应 用 训练 样本 对 网 
络 进行 训练 。 输 入 命令 : 

net=newff{minmax(p),[12,1],{'1logsig'，'purelin'}，'trainlm')， 

net .trainParam.show = 100， 

net .上 trainParam.epoch = 2000, 

net .上 trainParam.goal= le-4， 

[net ,tr]=train(necr,p, 尼 ) 7 

训练 和 迭 代 5 次 之 后 即 达 到 误差 性 能 目标 。 单 击 弹 出 的 nntraintool 窗口 中 的 
"Performance” 按 钮 ， 绘 出 误差 性 能 变化 曲线 ， 如 图 17-10 所 示 。 
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图 17-10 风 误差 变化 曲线 


侠 定义 测试 样本 向 量 ， 对 网 络 进行 仿真 ， 并 将 期 望 输出 、 预 测 结果 以 及 预测 误差 组 
合 输出 。 输 入 命令 : 


ptest(:,1)=[p0(23) p0(24) p0(25) p0(26)]' 7 
ptest(:,2)=[p0(24) p0(25) p0(26) p0(27)] 
ptest(:,3)=[p0(25) p0(26) p0(27) Dp0(28)] 
ttest (1) =p0(27) 

ttest (2)=p0(28) 

ttest (3)=p0(29) 7 

result_test = sim(net,p); 

result_testl = sim(net,ptest) 

delta = result_test1-ttest 

result = [result_test result_test1]7 


plot([1:25],p0(5:29)，'-r* [1:25] ,result，'-o') 
输出 结果 为 : 

result_test1l = 0.7813 0.9211 1.0562 
daelta = -0.1363 -0.0789 ”0.0611 


点 的 相对 预测 误差 为 王 14.85% “7.89% ”6.14%]。 绘 出 的 预测 曲线 如 图 17-11 所 示 ， 
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检验 样本 点 。 
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蚀 17-11 ”预测 曲线 与 真实 数据 


由 图 可 见 ， 网 络 预测 具有 一 定 的 误差 ， 并 不 能 够 保证 每 一 个 点 的 预测 值 和 股价 变动 赵 
势 都 与 实际 值 相 符 。 若 是 采用 更 大 容量 的 样本 ， 可 能 会 得 到 更 好 的 预测 精度 ， 这 是 需要 进 
一 步 研 究 的 问题 。 





有 ER 量 基于 神经 网 络 的 信用 风险 预测 





17.6.1 问题 背景 


信用 风险 又 称 违约 风险 ， 是 指 借款 人 、 证 券 发 行人 或 交易 对 方 因 种 种 原因 不 愿 或 无 力 
履行 合同 条 件 而 构成 违约 ， 致 使 银行 、 投 资 者 或 交易 对 方 遭 受 损失 的 可 能 性 。 对 于 上 市 公 
司 而 言 ， 这 种 违约 行为 经 常 表现 为 拖欠 账 款 、 资 不 抵债 ， 以 及 以 发 行 证 券 或 债券 进行 图 钱 
的 失信 行为 。 对 这 种 违约 失信 的 可 能 性 的 度量 显得 十 分 重要 ， 建 立 上 市 公司 信用 风险 评价 
模型 是 防范 信用 风险 的 重要 手段 。 

国外 对 于 信用 风险 预测 模型 的 研究 相对 比较 成 熟 ， 在 统计 方法 运用 方面 主要 有 以 下 几 
个 模型 。 

(1) 单 变量 分 析 法 

单 变量 分 析 是 最 早 应 用 于 财务 困境 预测 的 模型 ， 其 主要 思想 是 通过 比较 财务 困境 企业 
和 非 财务 困境 企业 之 间 某 个 财务 指标 的 显著 差异 ， 从 而 对 财务 困境 企业 提出 预警。 

(2) 多 元 判别 分 析 法 

为 了 克服 单 变 量 分 析 的 局 限 性 , 通过 多 元 判别 模型 产生 了 一 个 总 的 判别 分 , 称 为 Z 值 ， 
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并 依据 乙 值 进行 判断 。 该 模型 也 成 为 忆 模 型 。Z 模型 在 破产 前 ! 年 预测 精确 度 达到 95%， 
前 2 年 精确 度 达 到 72%， 但 是 从 前 3 年 起 精确 度 就 小 于 50% 了 。 

(3) Logistic 回归 模型 

Logit 分 析 广泛 应 用 于 财务 困境 预测 方面 。 许多 国家 的 研究 者 都 分 别 建立 了 适合 本 国 
情况 的 Logit 模型 。 

(4) 神经 网 络 模型 

运用 BP 神经 网 络 的 对 财务 危机 进行 预测 。 结 果 发 现 ， 神 经 网 络 模型 的 效果 要 明显 好 
于 判别 分 析 模 型 。 

运用 神经 网 络 的 对 财务 危机 进行 预测 ， 是 一 种 可 行 、 有 效 的 方法 。 


17.6.2 ”问题 实例 


【 例 17-5】 ”信用 风险 预测 实例 。 以 2007 年 和 2008 年 我 国 沪 深 两 市 上 市 公司 中 首次 
被 ST ( 特别 处 理 ) 的 制造 业 上 市 公司 为 对 象 ， 应 用 径 向 基 概 率 神经 网 络 进行 信用 风险 预 
测 研究 ， 将 其 划分 为 有 风险 和 无 风险 两 类 。 经 统计 ，2007 年 首次 被 ST 的 制造 业 上 市 公司 
有 18 家 ，2008 年 首次 被 ST 的 制造 业 上 市 公司 有 20 家 。 现 在 根据 第 ( -3 ) 年 上 市 公司 的 
年 度 财务 数据 来 预测 在 第 ! 年 是 否 成 为 ST 公司 。 


在 18 家 2007 年 首次 被 ST 的 制造 业 上 市 公司 选取 15 家 、 在 20 家 2008 年 首次 被 ST 
的 制造 业 上 市 公司 中 选取 15 家 ， 即 共 30 家 作为 研究 样本 ， 将 这 30 家 配对 的 正常 公司 作 
为 配对 样本 。 剩 余 的 8 家 ST 公司 与 8 家 正常 公司 作为 验证 样本 ， 如 表 17-8 所 示 。 由 于 数 
据 量 较 多 ， 故 此 处 数据 没有 完全 列 出 ， 详 细 数据 见 本 章光 盘 附 带 的 ST30、NST30、ST08、 
NST08 四 个 Excel 文件 。 








表 17-8 ”部 分 样本 数据 




















































































资产 总 资产 每 股 营 
二 每 股 收益 每 股 净 资 产 
代码 报酬 率 净利 润 率 | 业 收入 
000403 -0.08143 -0.10428 -1.07308 | 3.164212 2.551181 
000408 -0.007087 -0.03303 -0.32309 1.866199 3.666225 
000631 -0.155459 -0.18834 -2.22178 3.367119 | 0.333422 
000719 -0.038932 0.001122 0.006646 1.663097 2.187275 
000732 -0.050868 -0.08843 ee -0.53519 时 | 4.067818 1， 2.011746 
000757 -0.002219 | ooa4n -0.22662 4.723867 1.866474 
000925 | -ooooos9 -0.03431 -0.22279 1.929084 4.031781 
000979 -0.277833 30516 -3.09592 3.736802 1.649247 
-0.153102 -0.22282 -0.99745 2.064274 1.579475 
解 ，(@》 定义 训练 样本 向 量 P，7 以 及 检验 样本 向 量 ptest。 其 中 己 与 了 前 30 列 为 ST 公司 
各 项 财务 指标 ， 后 30 列 对 应 非 ST 公司 各 项 财务 指标 ;ptest 前 8 列 对 应 ST 公司 各 项 财务 


指标 ， 后 8 列 对 应 非 ST 公司 各 项 财务 指标 。 
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在 MATLAB 命令 空间 中 输入 命令 : 


[filename，Pathname] = uigetfile('ST30.xls'); s# 读 入 30 家 ST 公司 数据 
file=[pathname filename]; 
x=xlsread(file); 


[filename，Ppathname] = uigetfile('NST30.xls') 1 % 读 入 30 家 非 sT 公司 数据 
file=[pathname filename]; 
Y=xlsread(file) 


s% 定 义 训练 输入 向 量 





% 读 入 8 家 ST 公司 数据 
file=[pathname filename]; 

x1=xlsread(file); 

[filename，pathname] = uigetfile('NST08.xls'); % 读 入 8 家 非 ST 公司 数据 
file=[pathname filename]1; 

yl1=xlsread(file); 

Ptest=[xl;y1]7 % 定 义 验证 输入 向 量 
Ptest=ptest ' 7 


人 构造 径 向 基 概 率 神 经 网 络 。 概 率 神经 网 络 结构 如 图 17-12 所 示 ， 该 网 络 为 两 层 结 
构 ， 输 入 层 采 用 高 斯 径 向 基 传递 函数 ， 输 出 层 采 用 竞争 传递 函数 ， 输 出 为 一 元 向 量 ， 只 有 
1 和 2 两 种 取 值 ， 适 用 于 模式 分 类 问题 。 


RH 人 Layer1 如 儒 
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图 17-12 ”概率 神经 网 络 结构 


在 建立 该 网 络 模型 时 , 使 用 的 样本 是 上 述 30 家 ST 公司 和 30 家 正常 公司 的 财务 数据 。 
利用 这 60 家 公司 的 26 个 财务 指标 数据 作为 为 径 向 基 概 率 神经 网 络 的 学 习 训练 样本 ， 通 过 
调整 网 络 模型 隐 含 层 的 节点 数目 ， 反 复 地 学 习 和 训练 来 确定 网 络 的 可 调整 参数 ， 从 而 建立 
起 径 向 基 概率 神经 网 络 模型 。 输 入 下 列 命令 ， 完 成 网 络 创建 : 

T2=T+11 

T2 = ind2vec(T2) 

spread = 1; 

net = newpnn(p,T2,spread) ; 


函数 newpnn 生成 概率 神经 网 络 ， 从 而 实现 公司 的 分 类 。 应 用 newpnn 函数 时 ， 设 定 径 
向 基 函 数 的 散布 常数 spread=1.0。 输 出 层 输出 只 有 两 个 值 ， 即 所 1 或 者 所 2。 概 率 神经 网 
络 相对 于 BP 神经 网 络 而 言 ， 网 络 创建 算法 更 为 高 效 ， 生 成 速度 更 快 ， 在 构建 之 后 不 需要 
对 网 络 进行 训练 便 可 直接 应 用 。 
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合 应 用 验证 样本 ptest 对 网 络 进行 仿真 ， 并 绘图 显示 。 输 入 命令 : 


RA = sim(net,p)7 

Rc = vec2ina(A) 

Atest = sim(net,ptest); 
Actest = vec2ina(Rtest) 
plot (Actest，re') 


绘 出 图 形 如 图 17-13 所 示 。 
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图 17-13 ”验证 样本 预测 值 


从 图 中 可 看 出 ， 被 ST 的 8 家 公司 中 有 两 家 被 误 判 为 正常 公司 ， 不 过 对 8 家 正常 公司 
的 判断 都 正确 。 所 以 该 模型 是 有 效 的 ， 其 预测 准确 率 是 非常 理想 的 。 

运用 基于 径 向 基 的 概率 神经 网 络 建立 财务 风险 预测 径 向 基 概率 神经 网 络 模型 ， 对 验证 
样本 预测 的 准确 率 能 达到 87.5%， 是 一 种 比较 理想 的 非 统计 方法 的 预测 模型 





本 章 首先 概述 了 神经 网 络 在 预测 中 的 应 用 ， 然 后 结合 5 个 大 例子 ， 综合 讲述 运用 
MATLAB 进行 神经 网 络 预测 。 
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Simulink 是 MATLAB 环境 下 用 于 系统 建 模 、 动 态 分 析 的 软件 包 。 利 用 Simulink， 用 
户 可 以 对 所 提出 的 问题 构建 相应 系统 ， 并 且 进 行 仿真 ， 查 看 运行 状况 。 

在 Simulink 环境 下 ， 用 户 可 以 通过 简单 的 拖 昌 操 作 ， 或 者 根据 需求 修改 现 有 的 模块 ， 
很 方便 地 构造 出 系统 模型 。Simulink 既 支 持 线性 系统 ， 也 支持 非 线性 系统 ， 既 支持 连续 时 
间 系 统 ， 也 支持 离散 时 间 系统 和 混合 系统 ， 以 及 多 抽样 率 系统 。 

在 科学 和 工程 领域 , 利用 Simulink 进行 建 模 以 及 解决 实际 问题 也 是 常见 的 方法 。 其 应 
用 领域 包括 航空 航天 与 国防 、 工 业 自动 化 、 通 信 、 电 子 与 信号 处 理 、 医 疗 器 械 等 各 个 方面 。 

Simulink 提供 GUI 图 形 用 户 界面 ， 用 户 可 以 通过 绘制 框图 的 方式 实现 建 模 过 程 。 它 还 
提供 了 各 种 信号 源 、 线 性 与 非 线性 组 件 、 连 接 器 模块 库 供用 户 选择 。 如 果 这 些 模 块 库 不 能 
够 满足 需求 的 话 ， 用 户 可 以 创建 自己 的 模块 。 利 用 GUI 可 以 简化 建 模 过 程 ， 迅 速 建立 编程 
语言 中 需要 用 差分 或 微分 方程 才能 够 表示 的 模块 。 

在 Simulink 中 各 种 模块 是 分 级 的 ， 用 户 可 以 采用 自 项 向 下 或 自 底 向 上 的 方式 创建 模 
型 ， 可 以 直接 查看 系统 顶层 框图 ， 双 击 组 件 以 查看 其 细节 。 此 方式 可 以 清晰 地 显示 模型 的 
组 成 结构 和 组 件 间 连 接 的 方式 。 

在 建 模 过 程 完成 之 后 ， 用 户 可 以 对 其 进行 仿真 ， 这 可 以 直接 通过 Simulink 菜单 或 
MATLAB 命令 实现 。 以 菜单 方式 进行 仿真 通常 是 很 方便 的 , 但 是 对 于 需要 批 处 理 的 仿真 过 
程 ， 例 如 Monte Carlo 模拟 这 样 的 过 程 ， 利 用 命令 行 方式 则 更 为 方便 ， 而 利用 Scope 模块 
或 其 他 显示 模块 ， 可 以 方便 地 查看 仿真 结果 。 

此 外 ，Simulink 可 以 完成 模型 分 析 的 工作 ， 这 也 可 以 通过 MATLAB 命令 行 的 方式 
实现 。 

本 章 我 们 首先 介绍 Simulink 的 神经 网 络 模块 组 件 ， 然 后 通过 实例 介绍 如 何 使 用 
Simulink 设计 神经 网 络 。 





_Simulink 神经 网 络 模块 


Simulink 中 的 神经 网 络 模块 组 件 ( NN Toolbox Blockset ) 是 MATLAB 神经 网 络 工具 箱 
的 重要 组 成 部 分 ， 可 以 通过 下 面 两 种 方式 打开 Simulink 神经 网 络 模块 库 。 

(1 ) 在 MATLAB 命令 区 中 ， 输 入 命令 neural。 

(2 ) 单 击 “Simulink Library Browser” 窗口 左边 子 窗口 中 神经 网 络 模块 库 前 面 的 加 号 
or 


利用 neural 命令 打开 的 神经 网 络 模块 组 件 窗口 如 图 18-1 所 示 。 
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图 18-1 ”神经 网 络 模块 组 件 窗口 


从 图 中 可 以 看 到 , 其 中 主要 包括 5 类 子 模块 组 件 ， 分 别 是 : 传递 函数 模块 库 ( Transfer 
Functions )、 网 络 输入 函数 模块 库 ( Net Input Functions )、 权 值 函数 模块 库 ( Weight 
Functions )、 处 理 函数 模块 库 ( Processing Functions )， 以 及 控制 系统 模块 库 ( Control 
Systems )。 下 面 对 这 些 子 模块 分 别 进 行 介绍 。 


18.1.1 ”传递 函数 模块 库 


双击 图 18-1 所 示 的 神经 网 络 模块 组 件 窗口 中 的 Transfer Functions 组 件 ， 将 弹出 传递 函 
数 模块 窗口 ， 如 图 18-2 所 示 。 





图 18-2 ”传递 函数 模块 窗口 


其 中 每 一 个 方 框 代 表 一 种 网 络 传递 函数 ， 可 供 选择 的 传递 函数 包括 以 下 几 种 。 
e compet: 竞争 型 传递 函数 。 

。 harlim， 硬 限 值 传递 函数 。 

。 hardlims， 对 称 硬 限 值 传递 函数 。 
elogsig， 对 数 sigmoid 传递 函数 。 

e poslin， 正 线性 传递 函数 。 

e。 purelin:， 纯 线性 传递 函数 。 
eradbas: 径 向 基 传递 函数 。 

e satlin: 饱和 线性 传递 函数 。 

。 satlins， 对 称 饱和 线性 传递 函数 。 

。 softmax， 弱 最 大 值 传递 函数 。 

e tansig: 双 曲 正切 sigmoid 传递 函数 。 
。tribas: 三 角 基 传递 函数 。 
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。 netinv: 反 转 型 传递 函数 。 
其 中 每 一 种 传递 函数 的 输入 与 输出 的 维度 都 相同 。 


18.1.2 ”网 络 输入 函数 模块 库 


双击 图 18-1 所 示 的 神经 网 络 模块 组 件 窗口 中 的 “Net input Functions” 组 件 ， 将 弹出 网 
络 输入 函数 模块 窗口 ， 如 图 18-3 所 示 。 








图 18-3 ”网 络 输入 模块 窗口 


这 个 窗口 包含 两 种 网 络 输入 函数 。 

。netsum:， 加 减 计算 。 

enetprod， 向 量 点 积 运算 。 

其 中 每 一 种 模块 都 能 够 计算 任意 维度 的 输入 向 量 、 加 权 层 输出 向 量 ， 以 及 偏差 向 量 ， 
返回 一 个 网 络 输入 向 量 。 


18.1.3” 权 值 函数 模块 库 


双击 图 18-1 所 示 的 神经 网 络 模块 组 件 窗口 中 的 “Weight Functions” 组 件 ， 将 弹出 权 
值 函数 模块 窗口 ， 如 图 18-4 所 示 。 


癌 uararrneureyweient Fu 





图 18-4” 权 值 函数 模块 窗口 


这 个 窗口 包含 4 种 权 值 函数 。 

。 dotprod: 点 积 权 值 函数 。 

。 dist: 欧 氏 距离 权 值 函数 。 

。 negdist， 欧 氏 距离 负 值 计 算 权 值 函数 。 

。 normprod， 归 一 化 点 积 权 值 函数 。 

其 中 每 一 个 模块 都 以 一 个 神经 元 的 权 值 向 量 作为 输入 ， 将 其 与 输入 向 量 进 行 计算 ， 从 
而 得 到 神经 元 的 加 权 输 入 值 。 

需要 指出 的 是 ， 上 述 模块 需要 将 神经 元 的 权 值 向 量 定义 为 一 个 列 向 量 ， 这 是 因为 
Simulink 信号 只 能 是 列 向 量 ， 而 不 能 是 矩阵 或 者 行 向 量 的 形式 。 由 于 这 个 限制 ， 如 果 用 户 
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想 要 实现 一 个 具有 $ 个 神经 元 的 网 络 层 的 权 值 矩 阵 ， 就 需要 调用 $ 个 权 值 函数 模块 ， 每 个 
模块 代表 一 行 。 


18.1.4 ”处 理 函 数 模块 库 


双击 图 18-1 所 示 的 神经 网 络 模块 组 件 窗口 中 的 “Processing Functions” 组 件 ， 将 弹出 
处 理 函 数 模块 窗口 ， 如 图 18-5 所 示 。 




















图 18-5 处 理 函 数 模块 窗口 


这 个 窗口 包含 5 种 处 理 函数 及 其 对 应 的 反 函 数 ， 它 们 可 以 用 来 对 输入 进行 预 处 理 或 者 
对 输出 进行 后 处 理 。 

e fixunknowns， 修正 未 知 处 理 。 

ea mapminmax， 映 射 最 小 最 大 处 理 。 

e mapstd， 标 准 差 均值 映射 处 理 。 

e processpca， procwsspca 处 理 。 

eremoveconstantrows， 删除 常数 行 处 理 。 

e removerows: 删除 行 处 理 。 


18.1.5 “控制 系统 模块 库 


双击 图 18-1 所 示 的 神经 网 络 模块 组 件 窗口 中 的 “Control Systems” 组 件 ， 将 弹出 控制 
系统 模块 窗口 ， 如 图 18-6 所 示 。 











图 18-6 ”控制 系统 模块 窗口 
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这 个 窗口 包含 了 四 个 控制 系统 模块 。 

。 Model Reference Controller:， 模型 参考 控制 器 。 

。NARMA-L2 Controller，NARMA-L2 控制 器 。 

。 NN Predictive Controller:， 神经 网 络 预测 控制 器 。 

es Graph:， 示波器 模块 。 

前 三 种 控制 模块 已 经 在 前 面 介绍 过 了 。 最 后 的 示波器 模块 在 Simulink 中 可 以 完成 实时 
显示 的 功能 。 


神经 网 络 Simulink 模型 设计 实例 


本 节 我 们 将 介绍 神经 网 络 Simulink 模型 设计 实例 。 首 先 介绍 相关 的 工具 箱 函数 
gensim。 此 函数 用 于 创建 一 个 Simulink 神经 网 络 模块 ， 以 便 应 用 于 Simulink 仿真 。 其 调用 
格式 如 下 

gensim(nebst) 

其 中 

enet 为 网 络 对 象 ; 

est 指定 了 网 络 的 采样 时 间 ( sample time )， 通 常 是 一 个 正 实数 。 

如 果 网 络 没有 与 输入 权 值 或 者 神经 元 层 权 值 相关 的 延迟 ， 可 将 参数 st 设 定 为 -1,， 这 样 
函数 gensim 将 生成 一 个 连续 采样 的 网 络 模型 。 

【 例 18-1】 根据 给 定 的 输入 和 输出 ， 设 计 一 个 线性 神经 网 络 ， 对 其 进行 逼近 ， 并 利 


用 Simulink 建立 系统 模型 进行 仿真 。 
解 ， 全 定义 输入 与 期 望 输出 样本 向 量 。 在 MATLAB 工作 区 输入 命令 ， 


入 :多 司 - 坟 二 7 
teafil3579]; 


然后 对 此 样本 集 应 用 newlin 函数 ， 生 成 一 个 线性 神经 网 络 。 输 入 命令 : 

net newlina(P,) 

下 面 对 网 络 进行 仿真 检验 。 输 入 命令 

Y = sim(net,p) 

得 到 输出 结果 为 : 

Y = 1.0000 3.0000 5.0000 7.0000 9.0000 

仿真 结果 说 明 ， 网 络 能 够 很 好 地 完成 对 输入 、 输 出 样本 向 量 的 线性 逼近 。 

全 下 面 利 用 gensim 函数 生成 上 述 网 络 的 Simulink 模型 。 输 入 命令 : 

gensim{(net,-1) 

其 中 设 定 第 二 个 参数 为 -1， 表 示 生 成 一 个 连续 时 间 采 样 的 网 络 模块 。 执 行 此 命令 ， 将 
弹出 一 个 Simulink 窗口 ， 如 图 18-7 所 示 。 
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图 18-7 ”生成 的 网 络 模型 窗口 


图 中 包含 了 一 个 “Neural Network” 模 块 ， 就 是 线性 网 络 生成 的 Simulink 仿真 模型 。 
其 输入 端 连 接 一 个 信 源 输入 ， 输 出 端 连接 一 个 示波器 模块 。 双 击 “Neural Network” 模 块 ， 
可 以 查看 其 详细 结构 ， 弹 出 的 图 形 如 图 18-8 所 示 。 


Tontitedeural Network * 
Eee ER 和 wpreton Fet Tooe Hp 


D 态 加 印 于 








图 18-8 ”网 络 模型 结构 


可 以 看 到 ， 网 络 为 单 层 结构 ， 有 一 个 输入 端 “xf{1j” 和 一 个 输出 端 “yY(1}”， "Layer 1" 是 
神经 元 层 ， 双击 此 “Layer 1” 模块 ， 可 以 进一步 查看 此 神经 网 络 层 的 详细 结构 ， 如 图 18-9 所 示 。 








图 18-9 线性 层 内 部 结构 
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可 以 看 到 ， 此 线性 层 中 包含 延迟 线 、 网 络 权 值 、 偏 差 、 求 和 网 络 输入 函数 、 线 性 传递 
函数 等 单元 ， 进 一 步 双击 各 个 单元 ， 可 以 得 到 各 自 的 属性 对 话 框 ， 通 过 编辑 对 话 框 中 的 属 
性 值 ， 可 以 改变 网 络 的 属性 。 

合 下 面 对 此 Simulink 网 络 模块 进行 仿真 。 

双击 图 18-7 窗口 中 的 “Inputl ”输入 模块 ， 弹 出 其 属性 对 话 框 ， 其 中 需要 输入 一 个 党 
数 作 为 输入 ， 此 初始 常数 值 为 0089， 是 一 个 随机 产生 的 常数 ， 将 其 中 的 常数 值 改 为 2， 如 
图 18-10 所 示 。 

单 击 “OK” 按 钮 ， 回 到 Simulink 工作 区 , 单 击 工作 窗口 中 的 启动 仿真 按钮 ”开始 仿 
真 ， 就 可 以 在 显示 屏 上 看 到 输出 波形 ， 如 图 18-11 所 示 。 


Block Parameters: xf1] 


xD) 可 曙 


自 户 凡 几 攀 枚 加 日 





图 18-10 ”输入 模块 的 属性 对 话 框 图 18-11 ”仿真 输出 


可 以 看 到 ， 输 出 值 为 3， 这 表明 模型 输出 结果 是 正确 的 。 
对 于 gensim 函数 的 应 用 和 Simulink 模块 的 仿真 ， 下 面 我 们 再 以 一 个 输入 为 向 量 的 例 
子 来 进行 介绍 。 
【 例 18-2】 ”给 定 一 个 多 元 输入 向 量 和 一 维 输出 向 量 ， 设 计 前 向 BP 神经 网 络 对 其 关 
系 进行 拟 合 ， 并 建立 Simulink 模型 仿真 。 
解 ; (定义 输入 与 期 望 输出 样本 向 量 。 在 MATLAB 工作 区 输入 命令 ， 
x=[0.1 0.5398 0.5325 0.5324; 
1 -0.9341 0.9339 -0.93271; 
1 -6.4617 0.8567 0.8850; 
1 10.3576 -10.1934 8.9586; 
:1 


10.9531 31.1317 51.2697]; 
t=[0.1 10.9630 31.1417 51.2796]; 


并 是 原始 的 输入 向 量 , 为 5x4 矩阵 , 因此 输入 向 量 为 五 元 列 向 量 ,! 是 原始 的 输出 向 量 ， 
我 们 首先 对 其 进行 归 一 化 处 理 。 输 入 命令 : 


for i=1:5 
P(i,:)=x(i,:)/max(abs(x(i,:)))7 
end 
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P， 
T=t/max(abs(c))， 


输出 结果 为 : 


P = 0.1853 。 1.0000 0.9865 “0.9863 
0.1071 -1.0000 “0.9998 -0.9985 
0.0155 -1.0000 ”0.1326 ”0.1370 
0.0097 1.0000 -0.9841 0.8649 
0.0020 “0.2136 ”0.6072 1.0000 
T = 0.0020 0.2138 0.6073 1.0000 
以 上 即 归 一 化 后 的 输入 输出 向 量 ， 下 面 我 们 利用 此 向 量 来 构建 BP 网 络 。 


全 建立 网 络 ， 并 对 其 进行 训练 。 输 入 命令 : 


net=newff (minmax(P),[5,1],{f'cansig'，,'logsig')，crainlm')7 
met=train(net,P,T) 7 


训练 过 程 中 将 弹出 nntraintool 窗口 ， 此 处 没有 对 训练 参数 进行 设置 ， 因 此 训练 过 程 采 
用 默认 设置 ， 对 网 络 进行 1000 次 迭代 训练 ， 训 练 过 程 中 的 误差 性 能 变化 曲线 如 图 18-12 
所 示 。 

















图 18-12 ”误差 性 能 变化 曲线 
侠 利用 gensim 函数 生成 上 述 网 络 的 Simulink 模型 。 输 入 命令 : 


gensim(net,-1) 
执行 此 命令 ， 生 成 的 是 一 个 连续 时 间 采 样 的 网 络 模块 ， 同 时 弹出 Simulink 窗口 ， 如 图 


18-13 所 示 。 
此 网 络 就 是 训练 完毕 的 网 络 ， 下 面 我 们 对 其 进行 仿真 。 
合 双击 数据 源 模块 ， 将 变量 设置 为 输入 向 量 己 的 第 二 列 向 量 ， 即 [Lir1;-1;1;0.2136]， 


如 图 18-14 所 示 。 
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图 18-13 生成 BP 网 络 的 Simulink 模型 





单 击 “OK” 按 钮 回 到 Simulink 工作 区 。 双 击 显示 模块 打开 显示 窗口 ， 然 后 单 击 启动 
仿真 按钮 电 开始 仿真 ， 就 可 以 在 显示 屏 上 看 到 仿真 结果 ， 如 图 18-15 所 示 。 
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图 18-14 设置 仿真 数据 源 图 18-15 ”仿真 结果 
可 以 看 到 ， 确 实 如 期 望 的 那样 ， 输 出 值 为 0.21， 等 于 输出 向 量 元 素 7(2) 的 值 。 


小 结 


本 章 讲 述 了 利用 Simulink 进行 神经 网 络 设计 的 基本 方法 和 实例 , 更 复杂 的 例子 读者 可 
以 结合 神经 网 络 控制 一 章 进行 学 习 ， 该 章 中 三 个 控制 系统 实例 都 具有 一 定 的 复杂 性 ， 需 要 
进一步 深入 的 学 习 。 
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对 于 大 多 数 应 用 情况 来 说 ， 使 用 前 面 各 章 所 介绍 的 MATLAB 工具 箱 函 数 就 能 够 设计 
出 切合 问题 需要 的 神经 网 络 。 然 而 ， 对 于 一 些 特定 的 需求 ， 单 纯 依靠 工具 箱 提 供 的 函数 是 
不 够 的 。 为 了 解决 此 问题 , MATLAB 工具 箱 提供 了 一 种 自 定义 网 络 结构 对 象 。 应 用 此 对 象 ， 
用 户 可 以 任意 指定 网 络 的 类 型 ， 并 且 在 建立 之 后 对 其 进行 初始 化 、 训 练 和 仿真 等 操作 。 

本 章 将 对 这 一 部 分 内 容 进行 介绍 ， 包 括 的 主要 内 容 如 下 。 

(1) 自 定 义 网 络 。 

( 2 ) 相关 工具 箱 函 数 。 

(3 ) 自 定义 函数 。 


通过 在 工作 区 输入 命令 nnnetwork, 可 以 查看 MATLAB 神经 网 络 工具 箱 提供 的 标准 网 
络 创建 函数 。 
MATLAB 神经 网 络 工具 箱 中 的 标准 网 络 创建 函数 如 表 19-1 所 示 。 


表 19-1 神经 网 络 工具 箱 标准 网 络 创建 函数 








创建 一 个 竞争 神经 元 层 

newef 上 全 建 一 个 前 向 级 联 BP 网 络 
evdudmm 创建 一 个 分 布 延 巡 网 络 

weim 创建 一 个 Elman 网 络 
创建 一 个 前 向 型 BP 网 络 

创建 一 个 前 向 型 输入 延 R BP 网 络 
创建 一 个 Fiuing 网 络 

创建 一 个 广义 回归 神经 网 络 
创建 一 个 Hopfield 反馈 网络 
创建 二 个 线性 网 络 层 
设计 一 个 线性 网 络 
创建 一 个 分 层 反馈 网 络 

创建 一 个 学 习 矢量 量化 网 络 
创建 一 个 有 给 出 到 答 入 反馈 的 BP 网 络 
创建 一 个 感知 器 神经 网 络 
创建 一 个 梳 率 神经 网 络 
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续 表 


















创建 一 个 模式 识别 网 络 
newrb 创建 一 个 径 向 基 神 经 网 络 
newrbe 创建 一 个 径 向 基 网 络 

创建 一 个 自 组织 映 射 网 络 


自 定 义 神经 网 络 设计 的 灵活 性 是 通过 面向 对 象 的 表示 方式 获得 的 。 在 以 对 象 结构 为 基 
础 的 表示 方式 下 ， 用 户 可 以 根据 需要 定义 不 同 的 网 络 结构 ， 并 对 网 络 设置 不 同 的 算法 ， 从 
而 完成 满足 具体 需要 的 设计 。 

我 们 可 以 从 一 个 空 网 络 开始 自 定义 网 络 设计 ， 这 个 空 的 网 络 对 象 可 以 利用 函数 
network 得 到 。 这 个 新 生成 的 结构 体 对 象 net 中 包含 了 许多 待定 的 参数 ， 这 些 都 需要 用 户 根 
据 自身 的 需求 自行 定义 。 

下 面 我 们 通过 一 个 实例 来 介绍 自 定义 网 络 的 过 程 。 


19.1.1 ”定制 网 络 


在 开始 创建 自 定义 网 络 之 前 ， 首 先 需要 确定 它 的 结构 。 本 节 将 介绍 如 何以 自 定义 方式 
生成 一 个 如 图 19-1 所 示 的 复杂 网 络 。 
第 1 层 和 第 2 层 第 3 居 


输入 输出 
下 2 人 人 个 























3x(1*5) 3 
二 一 一 一 二 二 7 
(=logsig(YW2;IPOPIDIHIW22pxtD) (0b=purelin(LW23aXkt-DHLWYIaMOHO2HLW32a2(k) 


图 19-1 需要 自 定义 生成 的 网 络 结构 


图 中 的 网 络 具 有 三 个 神经 元 层 ， 分 别 为 第 1 层 、 第 2 层 和 第 3 层 。 第 1 层 采 用 tansig 
传递 函数 ;第 2 层 带 有 延迟 线 ， 采 用 logsig 传递 函数 ; 第 3 层 采用 purelin 传递 函数 。 

网 络 有 两 个 输入 向 量 ， 分 别 为 Po，P?(k)， 输 入 向 量 pl 为 二 元 向 量 ， 输 入 取 值 范 
围 为 [0, 10]， 向 量 亚 (k) 为 五 元 向 量 ， 取 值 范围 为 -2, 2]。 

在 开始 设计 网 络 之 前 ， 首 先 需要 确定 网 络 的 初始 化 方案 和 训练 算法 。 在 这 里 ， 每 一 层 
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都 采用 Nguyen-Widrow 算法 进行 初始 化 ， 对 应 算法 函数 为 initmw。 每 一 层 的 网 络 训练 函数 
均 采 用 Levenberg-Marquartdt 反 向 传播 算法 ( 对 应 算法 函数 为 rainlm )。 
给 定 输入 向 量 样本 ， 训 练 中 采用 第 3 层 输 出 的 均 方 误差 值 作为 网 络 的 误差 性 能 函数 。 


19.1.2 ”定义 网 络 
本 节 将 通过 下 面 的 实例 ， 一 步 步 讲述 如 何 自 定义 神经 网 络 。 


【 例 19-1〗 利用 自 定义 方式 生成 如 图 19-1 所 示 的 神经 网 络 。 
解 : @ 生成 空 网 络 ， 首先 通过 network 函数 创建 一 个 新 网 络 ， 并 查看 其 属性 值 。 输 入 命令 : 


met=network 


便 生成 了 神经 网 络 。 在 生成 的 网 络 中 ， 各 种 属性 值 均 为 空 值 ， 即 生成 的 网 络 是 一 个 空 的 神 
经 网 络 对 象 。 

全 修改 网 络 属性 值 ， 对 网 络 进行 自 定义 。 

首先 将 网 络 的 输入 数目 设 定 为 2 个 ， 网 络 层 数 设 定 为 3 层 。 输 入 如 下 命令 ， 
2; 
齐 池 

需要 指出 的 是 ，numInputs 属性 指定 的 是 输入 向 量 源 的 个 数 ， 而 不 是 输入 向 量 中 的 元 
素 的 个 数 ， 向 量 中 元 素 的 个 数 由 参数 neLinputs{fij.size 给 出 。 

完成 上 述 定义 之 后 ， 输 入 net 命令 查看 网 络 属性 的 变化 情况 。 输 入 命令 ， 

met 
可 以 看 到 部 分 输出 结果 为 


net = Neural Network object: 
architecture: 

numInputs: 2 
numLayers: 3 
biasConnect: [0; 0; 0] 
inputConnecc: [0 0 0 0 0 0] 
layerConnect: [000; 000;000) 
outputConnect: [0 0 0] 


可 以 看 到 ， 网 络 输入 向 量 数 和 层 数 都 变 成 了 修改 后 的 值 。 而 偏差 连接 、 输 入 连接 、 层 
连接 、 输 出 连接 属性 都 是 零 向 量 。 这 表示 网 络 输入 、 输 出 ， 以 及 各 层 之 间 没 有 任何 的 连接 。 
侠 调整 网 络 的 偏差 连接 属性 。 
网 络 的 偏差 连接 矩阵 是 一 个 3xl 的 向 量 ， 为 创建 一 个 第 夺 层 的 偏差 连接 需要 将 
netbiasConnectf 计 的 值 设 为 1。 下 面 将 指定 网 络 的 第 1 层 与 第 3 层 有 偏差 连接 ， 如 图 19-1 
所 绘 出 的 那样 。 输 入 如 下 命令 : 


1 
1; 





net .numInputs 
net .numLayers 


net .biasConnect (1) 
net .biasConnect (3) 


或 采用 单行 的 方式 ， 输 入 命令 : 


中 
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met .biasConnect = [1; 0; 1]; 


就 可 以 完成 对 网 络 偏差 的 指定 。 

全 指定 输入 连接 、 层 权 值 连接 属性 。 

输入 连接 短 阵 是 一 个 3x2 的 和 矩阵， 表示 有 两 个 输入 向 量 ( 信号 源 )， 而 有 三 个 目标 层 
(接收 方 因此， 参数 netinputConnect(ij) 表 征 了 第 / 个 输入 到 第 ; 层 的 连接 情况 。 

为 了 在 第 1 个 输入 与 第 1 层 、 第 2 层 之 间 建 立 连 接 ， 以 及 在 第 2 个 输入 与 第 2 层 建立 
连接 ， 输 入 如 下 命令 : 

Pet . inputConnect (1,1) 


net .inputConnect (2,1) 
net .inputConnect (2,2) 


3 
17 
27 
或 者 采用 单行 的 方式 ， 输 入 命令 : 
net .inputConnect = [1 0; 1 1; 0 0]， 
即 可 完成 输入 连接 属性 的 设置 。 
类 似 的 ，netlayerConnect(ij) 表 征 了 从 第 层 到 第 ; 层 的 权 值 连接 情况 。 要 将 第 1、2、 
3 层 与 第 3 层 连 接 起 来 ， 输 入 如 下 命令 . 
net .1ayerConnect (3,1) 


net .layerConnect (3,2) 
net .LayerConnect (3,3) 


或 以 单行 的 方式 ， 输 入 命令 
met .layerConnect = [0 0 0; 00o; 1131)) 


即 可 完成 权 值 连接 的 设置 。 

人 @@ 指定 输出 连接 属性 。 

输出 连接 撼 阵 是 一 个 1x3 的 向 量 ， 表 示 具 有 3 个 输出 源 ( 三 个 网 络 层 ) 1 个 输出 目标 
( 网 络 外 部 )， 如 果 网 络 层 到 输出 目标 无 连接 ， 对 应 值 设 为 0， 有 连接 则 设置 为 1。 

从 图 19-1 中 可 看 到 ， 网 络 的 第 3 层 与 输出 有 连接 。 输 入 如 下 命 


net ,outpPutConnect = [0 0 1]; 


即 表示 第 3 层 与 输出 有 连接 ， 如 此 便 完 成 了 输出 连接 的 设置 。 
完成 上 述 网 络 结构 属性 的 设置 之 后 ， 可 以 通过 输入 net 命令 来 查看 网 络 的 属性 值 。 更 
改 后 的 网 络 属性 如 下 


met =Neural Network object: 
architecture: 

numInputs: 2 
numLayers: 3 
biasConnect: [1; 0; 1] 
inputConnect: [1 0; 1 1; 0 0] 
layerConnect: [000; 000;111) 
outputConnect: [0 0 1] 
numoutputs: 1 (read-only) 
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numInputDelays: 1 (read-only) 
numLayerDelays: 1 (read-only) 


而 网 络 的 子 结构 属性 为 : 


Subobject structures: 
inputs: {2xl cell} of inputs 
layers: {3xl cell) of layers 
outputs: {1x3 cel1)j containing 1 output 
biases: {3xl cel1l) containing 2 biases 
inputWeights: (3x2 cel1} containing 3 input weights 
layerWeights: {3x3 cell) containing 3 layer weights 


可 见 给 定 的 网 络 有 两 个 输出 ， 分 别 来 自 第 2 层 与 第 3 层 。 

全 设 定 输入 属性 。 

当 我 们 把 输入 数目 netnumInputs 的 值 设 定 为 2 时 ， 输入 属性 就 成 为 了 一 个 包含 两 个 输 
入 结构 的 cell 数组 。 其 中 ， 作 为 组 元 的 第 i 个 输入 结构 体 表 示 为 neLinputs{ijj， 包 含 了 与 第 
i 个 输入 的 相关 信息 。 

为 查看 输入 属性 结构 体 ， 可 以 输入 如 下 命令 : 


net ,inputs 
输出 结果 为 ， 


ans = [1x1l struct] 
[1xl1 scruct] 


继续 查看 第 1 个 输入 结构 体 的 内 容 。 输 入 命令 ， 
net .inputst1) 
输出 结果 为 ， 


ans = 
exampleInput: [0 1] 
processFcns: {) 
processParams: {) 
processSettings: {) 
processedRange: [0 1] 
processedSize: 1 
range: [0 1 
size: 1 
userdata: [1x1 struct] 


我 们 可 以 设 定 样本 输入 (exampleInput ) 的 值 ， 那么 其 后 的 参数 就 会 自动 的 根据 样本 
输入 的 值 设 定 。 

通过 如 下 命令 对 样本 输入 进行 设 定 : 

net .inputs{t1) .exampleInput = [0 10 5 0 3 101; 


此 后 ， 重 新 查看 第 1 个 输入 结构 体 的 值 ， 其 结果 如 下 所 示 : 





ans = 
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exampleInput: [2x3 double] 

Dname: 'ITnput 

ProcessFcns: {'removeconstantrows' “mapminmax'} 
ProcessParams: {[1xl struct] [1xl Sruct])} 
ProcessSettings: {[1xl struct] [1x1l struct]} 
processedRange: [2x2 double] 

processedsize: 2 

range: [2x2 double] 

Size: 2 

userdata: [1xl struct] 


可 见 ， 根 据 我 们 所 指定 的 样本 值 ，exampleInput 变 成 了 一 个 2x3 的 矩阵 ， 而 且 name、 
ProcessFcns 等 属性 值 确 实 根据 样本 输入 值 自动 进行 了 调整 。 其 中 处 理 函数 processFcns 的 
值 为 {removeconstantrows” "mapminmax'} ， 表示 在 网 络 进行 训练 或 仿真 之 前 ， 首 先 要 删除 
输入 的 常数 行 ， 并 且 对 输入 的 最 大 和 最 小 值 进行 映射 ， 随 后 的 参数 processParams 指定 的 
是 处 理 函数 的 参数 。 

下 面 在 不 指定 处 理 函 数 的 情况 下 ， 将 第 2 个 输入 的 大 小 设 定 为 5。 输 入 如 下 命令 ， 

net ,inputs{2} .size = 5) 

人 @@ 设 定 层 属性 。 

当 我 们 将 层 数目 参数 neLnumLayers 指定 为 3 时 ， 层 属性 就 成 为 了 一 个 3 维 的 cell 数 
组 。 可 以 输入 下 面 的 命令 ， 查 看 第 1 层 的 属性 : 


net ,layers{f1) 
得 到 的 结果 为 : 


ans = 
dimensions: 1 
distanceFcn: 'dist， 
aistances: 0 
initFcn: "initwb' 
netInputFcn: netsunm' 
netInputParam: [1xl struct] 
positions: 0 
Size: 工 
topologyFcn: 'hextop， 
transferFcn: 'purelin' 
transferParam: [1xl struct] 
userdata: [1x1 struct] 


现在 需要 将 第 1 层 设 置 为 4 个 神经 元 ， 传 递 函数 设置 为 tansig， 初 始 化 函数 设 定 为 
Nguyen-Widrow 函数 。 输 入 命令 : 


met .layers{1l).size = 4; 
net .layers{f1}.transferFcn = 'tansig'， 
net .layers{f1l}.initFcn = 'initnw'; 


将 第 2 层 设置 为 3 个 神经 元 ， 传 递 函数 设置 为 logsig ， 初 始 化 函数 同样 设 定 为 
Nguyen-Widrow 函数 。 输 入 命令 : 
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net .layers{t2}.size = 3) 
net .layers{t2}.EransferFcn = '1ogsig'7 
net ,layers{2} .initFcn =“'initnw' 


对 于 第 3 层 , 其 大 小 默认 为 1 个 神经 元 ,， 传递 函数 默认 为 purelin， 这 正 符合 我 们 想 要 构 
建 的 网 络 的 需求 ， 因 此 不 需要 更 改 ， 但 是 我 们 还 需要 指定 网 络 层 的 初始 化 函数 。 输 入 命 


net .layers{3} .initFcn =“'inicnw'"; 


以 上 就 完成 了 网 络 层 属性 的 设 定 。 
合 设 定 输出 向 量 的 属性 。 
首先 ， 可 以 查看 目前 输出 向 量 的 属性 。 在 MATLAB 工作 区 输入 如 下 命令 : 





met .OutpPuts 

输出 结果 为 : 

ans = [] 0 [lxl struct] 

可 以 看 到 ， 输 出 属性 为 一 个 1x3 的 cell 数组 ， 其 中 第 3 个 cell 单元 为 结构 体 类 型 ， 代 
表 第 3 层 的 输出 。 这 是 在 我 们 将 参数 neLoutputConnect 设 定 为 [0 0 1 的 时 候 自动 确定 的 。 

查看 第 2 层 的 输出 结构 体 ， 输 入 命令 : 

net .outputs{2)} 


输出 结果 为 


ans = 
exampleoutput: [3x2 double] 
name: 'Output， 
processFcns: {) 
processParams: {]} 





processSettings: {) 
processedRange: [3x2 doublel 
processedsize: 3 

range: 3 

size: 3 


userdata: [1xl strucr] 
可 以 看 到 ，size 的 值 为 3， 这 是 在 我 们 将 neLlayer{t2}.size 设 定 为 3 时 就 自动 设 定 的 。 
也 可 以 通过 类 似 的 方法 检查 第 3 层 的 输出 情况 。 输 入 命令 : 
net .outputs{3) 
输出 结果 为 : 


ans = 
exampleoutput: [-Inf Inf] 
name: 'OuEpuL 
processFcns: {)} 
ProcesspParams: {)} 
processSettings: {} 
processedRange: [-InE Inf1 
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ProcessedSize: 1 
range: 工 

Size: 1 

userdata: [1x1l struct] 


可 见 第 3 层 输出 的 size 为 1， 这 是 期 望 的 值 。 由 于 第 1 层 没有 输出 ， 因 此 如 果 用 类 似 
的 方法 查看 将 无 效 ， 得 到 的 输出 结果 是 一 个 空 集 。 

需要 指出 的 是 ， 在 较 低 版 本 的 工具 箱 中 ， 输 出 与 目标 响应 两 者 是 分 开 的， 因此 还 需要 
指定 目标 响应 的 属性 。 但 是 在 高 版 本 神经 网 络 工具 箱 中 ， 与 处 理 过 程 相关 的 各 种 属性 是 自 
动 应 用 在 训练 过 程 中 的 目标 响应 上 的 ， 因 此 不 需要 单独 指定 目标 响应 的 属性 。 

与 输入 处 理 属性 类 似 ， 如 果 对 exampleOutput 属性 进行 了 设 定 ， 则 其 后 的 参数 都 会 自 
动 更 新 。 

余 设 定 偏差 、 输 入 权 值 、 层 权 值 属 性 。 

首先 查看 偏差 属性 。 在 MATLAB 工作 区 输入 如 下 命 


met .biases 
输出 结果 为 : 


ans = 
[lxl struct] 
时 
[1x1 szruct] 


以 上 显示 的 就 是 偏差 属性 cell 数组 。 然 后 查看 输入 权 值 属 性 ， 输 入 命令 : 
net .inputweights 
输出 结果 为 : 


ans = [1xl struct] 0[] 
[1x1 scruct] 。 [lxl struct] 


D 0] 
这 是 输入 权 值 属性 cell 数组 。 接 下 来 查看 层 权 值 属性 ， 输 入 命 


pnet .layerWeights 


ans = 0 [ D 
[] [ 0 
[1x1l struct] [1xl struct] [lxl struct] 


其 中 各 个 矩阵 中 包含 结构 体 的 位 置 就 是 相应 的 连接 值 netbiasConnect 为 1 的 位 置 。 还 
可 以 进一步 查看 各 个 结构 体 的 值 , 例如 查看 偏差 向 量 中 第 1 个 结构 体 的 值 。 输 入 如 下 命令 : 


net .biasesf1} 
输出 结果 为 : 


ans = 
initFcn: 
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learn: 工 





learnFcn: ' 
learnParam: 

size: 4 

userdata: [1x1 scruct] 


类 似 的 ， 输 入 下 面 的 命令 ， 还 可 以 查看 各 个 具体 结构 体 的 值 。 


net .biases{t3) 

net .inputweights{t1,1) 
net .inputWeightst2,1) 
net .inputWeights{2,2)} 
net .layerWeightsft3,1} 
net .layerWeights{t3,21 
nec .layerWeights{3,3)} 


这 里 不 再 一 一 列 出 以 上 命令 的 执行 结果 ,读者 可 执行 命令 自行 查看 。 下 面 根据 图 19-1 
中 网 络 的 结构 ， 对 权 值 中 的 延迟 线 进行 指定 。 输 入 命令 : 
net .inputweights{t2,1) .delays = [0 1]; 


net .inputWeights{t2,2}.delays = 17 
net .layerWeights{3,3}.delays = 17 


以 上 输入 表明 ， 第 1 个 输入 到 网 络 第 2 层 的 延迟 线 结构 为 [0 1]， 第 2 个 输入 到 网 络 第 
2 层 的 延迟 为 1， 从 第 3 层 输出 到 第 3 层 输入 的 延迟 为 1。 


全 设 定 网 络 函 数 。 
从 网 络 属性 中 我 们 可 以 看 到 ， 网 络 中 各 种 函数 都 是 没有 设置 的 ， 显 示 如 下 ; 
functions: 


adaptFcn: (none) 
divideFcn: (none) 
gradientFcn: (none) 
initFcn: (none) 
performFcn: (none) 
PlotFcns: {] 
trainFcn: (none) 


将 网 络 初始 化 函数 initFcn 设置 为 initay， 表示 网 络 将 采用 层 的 初始 化 函数 完成 网 络 自 
身 的 初始 化 ， 也 就 是 采用 Nguyen-Widrow 函数 进行 初始 化 。 输 入 命令 : 

met .initFcn = “'initlay'7 

将 网 络 性 能 函数 perfermFcn 设置 为 mse， 也 就 是 均 方 误差 。 将 训练 函数 trainFcn 设置 
为 trainlm， 也 就 是 Levenberg-Marquardt 反 向 传播 算法 ， 这 是 符合 图 19-1 网 络 要 求 的 设置 。 
在 MATLAB 工作 区 中 输入 命令 : 


met .performFcn = 'mse' 

met .trainFcn = 'trainlm' 1 

将 数据 划分 函数 divideFcn 设置 为 dividerand， 即 随机 划分 训练 数据 。 输 入 命令 ， 
net .divideFcn =“'dividerand'; 
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在 有 监督 训练 的 情况 下 ， 输 入 和 目标 响应 数据 以 随机 的 方式 划分 为 数 个 训练 、 测 试 、 
验证 数据 集 。 在 学 习 过 程 中 ， 通 过 训练 数据 集 对 网 络 进行 训练 ， 直 到 通过 验证 数据 集 验 证 
到 其 网 络 性 能 开始 下 降 为 止 ， 此 时 性 能 达到 峰值 。 接 下 来 ， 利 用 测试 数据 集 对 网 络 性 能 提 
供 另 外 一 次 完全 独立 的 测试 。 

将 绘图 函数 plotFcn 设置 为 plotperform 函数 和 plottrainstate 函数 。 其 中 ，plotperform 
对 训练 、 验 证 、 测 试 过 程 中 的 性 能 函数 绘图 显示 ， 而 plottrainstate 函数 则 对 训练 算法 中 每 
一 阶段 的 状态 绘图 显示 。 输 入 命令 : 


net .plotFcns = {'plotperform','plottrainstate')j; 
以 上 就 完成 了 网 络 函 数 的 设置 。 输 入 net 命令 检查 设置 后 的 网 络 函 数 ， 结 果 为 ， 


functions: 
adaptFcn: (none) 
divideFcn: 'dqiviaderand' 
gradientFcn: 'gdefaults' 
initFcn: 'inictlay 
performFcn: 'mse' 
plotFcns: {'plotperform','ploctrainstate')} 
trainFcn: "trainim' 





侠 设 定 权 值 和 偏差 值 。 
在 此 之 前 ， 再 查看 一 下 网 络 属性 中 最 后 一 组 的 情况 ， 其 值 为 : 
IW: {3x2 cel1} containing 3 input weight matrices 


LW: {3x3 cel1}) containing 3 Layer weight matrices 
b: {3xl cel1l) containing 2 bias vectors 


其 中 的 cell 数组 包含 连接 属性 ( 即 neLinputConnect,netlayerConnect,netbiasConnect )、 
也 包含 子 对 象 属性 ( neLinputWeights ，netlayerWeights，netbiases ) ， 以 及 网 络 权 值 矩 阵 
和 偏差 向 量 。 

输入 下 列 命令 ， 可 以 查看 各 个 权 值 和 偏差 向 量 的 值 。 

net .ITW{1,1}，net.IW{2,1}，net.IW{2,2) 


net.LW{3,1})，net.LW{3,2}，net .LN{3,3) 
met .bf1}，net.bf{3)} 


例如 ， 查 看 第 1 层 输 入 权 值 和 矩阵 TIW{1，1} 的 值 。 输 入 命令 : 


net .IW{1,1)} 


输出 结果 为 : 

ans =0 0 
0 0 
0 0 
0 0 


第 1 层 输入 权 值 和 矩阵 TW{1，1) 的 行 数 与 第 1 层 神 经 元 数目 ( netlayers{1j.size ) 相同 ， 
而 第 1 层 输 入 权 值 和 矩阵 的 列 数 与 网 络 输入 的 维 数 ( netinputs{1}.size ) 相等 。 由 上 面 的 执行 
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结果 可 见 ， 第 1 层 的 输入 权 值 矩阵 元 素 的 值 均 设置 为 0。 
同样 ， 输 入 命令 : 
net.LW{3,11} 
输出 结果 为 : 
ans= 0 0 0 


层 权 值 和 矩阵 neLLW{3,1} 的 列 数 等 于 第 1 层 神经 元 数目 ( netlayers{1]j.size ) 与 延迟 值 
(lengthnetinputWeights{fij}.delays) 的 乘积 。 上 述 结果 表明 第 1 层 连 接 权 值 初 值 均 为 0。 
输入 命令 : 


met .bf11 


输出 结果 为 : 





ans = 0 
0 
0 
0 
这 表明 第 1 层 偏差 初 值 均 设置 为 0。 对 于 此 例 ， 我 们 保持 其 初始 值 为 0 不 变 即 可 。 


19.1.3 网络 行 为 

在 19.1.2 节 完 成 了 网 络 结 构 的 属性 设置 ,下 面 就 可 以 开始 对 网 络 的 权 值 偏差 进行 设置 、 
训练 ， 从 而 完成 仿真 。 本 节 延 续 上 面 的 步骤 ， 继 续 进行 自 定 义 。 

侈 网络 初始 化 。 输 入 如 下 命令 : 

ne = init (tnet); 

通过 下 列 命令 ， 可 以 再 次 检查 网 络 的 权 值 和 偏差 矩阵 。 


net.IW{1,1})，net.IW(2,1}，net.IW{2,2)} 
net .LW{3,1}，net.LW(3,2)}，net.LnW{3,3)} 
net .bf{1}，net.bf3)} 


例如 ， 输 入 命令 : 
net .IW{t1,1)， 


输出 结果 为 ， 


ans = 
2.5810 1.0855 
1.9880 -1.9717 
-2.4075 “ -1.4296 
2.7822 0.3155 


输入 命令 : 


met .LNW{3,1)， 
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ans = -0.6576 0.4121 -0.9363 -0.4462 


net .bf1}， 
输出 结果 为 


ans = 
-2.8000 
-0.9333 
-0.9333 
2.8000 


以 上 即 完成 了 网 络 权 值 和 偏差 的 初始 化 。 

舍 对 网 络 进行 训练 ， 定 义 一 个 具有 两 个 输入 向 量 的 cell 数组 作为 样本 输入 ， 一 个 为 
二 元 向 量 ， 另 一 个 为 五 元 向 量 。 输 入 命令 : 

P= ([0; 0] [2; 0.5]; [2; -27 


输出 结果 为 ， 


P = 
[2xl double] [2xl doublej] 
[5xl double] [5xl Goublel] 


同时 定义 期 望 目标 响应 ， 也 是 cell 数组 ， 具 有 两 个 元 素 。 输 入 命令 ， 





m = {1 -1)， 
输出 结果 为 : 
?= [1 -1 


在 开始 训练 之 前 ， 可 以 先 利用 输入 样本 对 初始 化 的 网 络 进行 仿真 ， 查 看 它 的 输出 是 否 
与 期 望 目标 响应 接近 。 输 入 命令 ， 

Y = sim(net,P) 

输出 结果 为 : 

Y=[ 1.4709]  [ 1.1346] 


输出 了 正 是 对 应 输入 向 量 己 的 两 组 输出 值 。 从 上 面 的 结果 可 以 看 到 , 第 2 组 输出 与 期 
望 响应 -1 相差 是 非常 远 的 ， 初始 化 的 网 络 还 不 能 够 完成 对 应 的 功能 ， 因 此 需要 对 网 络 进行 


训练 。 
首先 查看 训练 参数 。 输 入 如 下 命令 : 


net .trainParam 
输出 结果 为 : 


ans = 
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Show: 25 
showwindow: 1 
ShowCommandGLine: 0 
epochs: 1000 

time: Inf 

goal: 0 

max_fail: 6 
mem_reduc: 1 
min_grad: 1.0000e-010 
mu: 1.0000e-003 
mu_aec: 0.1000 
mu_inc: 10 

mu_max: 1.0000e+010 


其 中 训练 目标 值 初始 设 定 值 goal 为 0， 我们 将 其 修改 为 le-10。 输 入 命令 ， 

net ,trainParam.goal = le-10; 

然后 调用 train 函数 开始 训练 。 输 入 命令 : 

net = Erain(net,PvT); 

训练 完毕 ， 三 步 之 后 就 达到 了 训练 目标 。 网 络 误差 性 能 的 变化 如 图 19-2 所 示 。 
= ago 





Best Traing Perbmmance ts NaN epoch 3 














和 上 5 上 四 立 于 3 
3 Epochs 








图 19-2 ”训练 过 程 中 网 络 误差 性 能 的 变化 
对 训练 后 的 网 络 进行 仿真 。 输 入 命令 : 


Y = simtnet,P) 
得 到 结果 为 : 
Y = [1.0000] 。 [-1.0000] 


可 见 训练 后 的 网 络 实现 了 预期 的 功能 。 以 上 我 们 就 介绍 了 以 自 定义 的 方式 实现 网 络 的 
全 过 程 。 用 户 在 处 理 实际 问题 时 ， 可 以 用 类 似 的 方法 灵活 实现 网 络 的 自 定义 。 
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相关 工具 箱 函数 


前 面 的 章节 中 介绍 的 神经 网 络 工具 箱 函 数 都 是 针对 标准 工具 箱 网 络 设 定 的 ， 本 节 将 介 
绍 的 是 与 自 定 义 网 络 相关 的 工具 箱 函数 ， 这 些 函 数 可 以 用 于 用 户 自 定 义 网 络 ， 主 要 包括 初 
始 化 函数 、 传 递 函 数 以 及 学 习 函 数 几 个 部 分 。 


19.2.1 “初始 化 函数 
自 定义 网 络 相关 的 初始 化 函数 有 randnc 和 randnr， 下 面 对 其 进行 介绍 。 


1. randnc 


此 函数 是 一 个 权 值 初始 化 函数 ， 其 调用 格式 为 : 
且 =randnc(S,PR) 
风 =randnc(S,R) 
其 中 
。 3 为 神经 元 的 数目 ; 
。 PR 为 Rx2 的 矩阵 ， 取 值 范围 为 [Pmin Pmax]。 
函数 返回 一 个 随机 的 初始 化 权 值 和 矩阵 ， 并 且 和 矩阵 列 向 量 已 经 归 一 化 。 
2. randnr 
此 函数 也 是 权 值 初 始 化 函数 ， 其 调用 格式 为 
多 =randnr(S,PR) 
凡 =randnr(S,R) 
与 randnc 类 似 ， 其 中 $ 也 是 神经 元 的 输入 ;，PR 为 Rx2 的 矩阵 ， 代 表 输入 取 值 范围 。 
函数 执行 后 同样 也 是 返回 一 个 初始 化 的 权 值 矩阵 ， 但 和 矩阵 采用 的 是 行 向 量 归 一 化 。 


19.2.2 ”传递 函数 
自 定义 网 络 相关 的 传递 函数 包括 satlin、softmax 和 tribas， 下 面 逐 一 介绍 。 


1，satlin 
此 函数 为 饱和 线性 传递 函数 。 其 调用 格式 为 : 


4 = satlin(N,FP) 
其 中 : 
。 N 为 SxQ 的 矩阵 ， 代 表 网 络 输入 列 向 量 ; 
。 FP 是 函数 参数 结构 体 ， 可 以 省 略 。 
此 传递 函数 仍然 是 一 个 线性 函数 ， 但 与 purelin 不 同 的 是 ， 其 取 值 范围 限定 在 [0,.1] 内 ， 
其 最 小 值 为 0， 最 大 值 为 1。 
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利用 下 面 代码 可 以 得 到 satlin 函数 的 图 : 








n = -2:0.1:2; 
a = Satlin(tn): 
plot (na) 


绘 出 的 图 形 如 图 19-3 所 示 。 
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图 19-3 satlin 传递 函数 
此 函数 应 用 于 网 络 时， 可 以 采用 下 面 的 语句 : 


net .layers{i).transferFcn = 'satlin'7 
即将 第 i 层 的 传递 函数 设置 成 为 satlin 函数 。 
2，softmax 
此 传递 函数 是 竞争 传递 函数 的 一 个 软 版 本 ， 具有 最 大 网 络 输入 的 神经 元 得 到 一 个 比较 


接近 于 1 的 输出 ， 而 其 他 神经 元 则 得 到 比较 接近 于 0 的 输出 。 这 与 竞争 函数 输出 为 绝对 的 
1 和 0 是 有 所 不 同 的 。 其 调用 格式 为 : 


A=softmax(N) 
其 中 N 为 SxO 的 网 络 输入 向 量 。 
我 们 可 以 利用 下 面 的 代码 来 观察 softmax 函数 的 性 能 。 输入 如 下 命令 : 


刀 [0; 1; -0.5; 0.5]7 


aa = Softmax (mn) 7 
subplot (2,1,1)，bar(n)，ylabel('n') 
subplot(2,1,2)，bar(al)，yYlabel('a') 


绘图 的 结果 如 图 19-4 所 示 。 
在 网 络 中 调用 此 函数 时 通常 用 如 下 语句 


net .layers{i).transferFcn = “Softmax 1; 
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即将 第 i 层 的 传递 函数 设置 成 为 softmax 函数 。 


1 
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图 19-4 softmax 传递 函数 











3. tribas 
此 传递 函数 是 一 个 三 角形 的 径 向 基 函 数 ， 其 调用 格式 为 
A = tribas (N,FP) 


daA_dN = tribas('dn',N,A,FP) 
info = tribas(code) 


其 中 N 为 Sx@C 的 网 络 输入 向 量 。 
通过 下 面 的 代码 可 以 绘制 出 三 角 径 向 基 函 数 的 图 形 。 输 入 命令 
n = -2:0.1:2; 


a = tribas(n) 
plot (n,a) 


绘 出 的 图 形 如 图 19-5 所 示 。 
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图 19-5 tribas 传递 函数 
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此 函数 应 用 于 网 络 中 ， 可 以 采用 下 面 的 语句 : 


net .layersfil.transferFcn = 'tribas' 


即将 第 i 层 的 传递 函数 设置 成 为 ribas 函数 。 


19.2.3 “学习 函数 


神经 网 络 工具 箱 中 非 标准 的 学 习 函 数 还 包括 learnh、learmhd、leamis 以 及 learnos， 下 


面 分 别 对 其 进行 介绍 。 


二 


learnh 


此 函数 为 Hebb 权 值 学 习 函 数 ， 按 照 乘积 、 权 值 输入 、 神 经 元 输出 的 比例 来 改变 权 值 。 


其 调用 格式 为 


产 


[dWLS] = leamh(W, P, Z, N,4,T, 屯 ,gW,gA,D,LPLS) 
info = learnh(code) 

其 中 ， 

。 多 为 SxR 的 权 值 矩阵 ; 

e 己 为 RxC 的 输入 向 量 ; 

e。Z 为 SxC 的 加 权 输入 向 量 ; 

e。 N 为 SxC 的 网 络 输入 向 量 ; 

。 4 为 SxQ 的 输出 向 量 ; 

e 了 为 Sx@C 的 层 目标 向 量 ; 

e 巨 为 SxC 的 层 误差 向 量 ; 

egW 为 SxR 的 性 能 相关 梯度 ; 

。gA 为 Sx@ 的 性 能 相关 输出 梯度 ; 

e 站 为 SxS 的 神经 元 距离 ， 

。 LP 为 学 习 参数 ; 

e LS 为 学 习 状态 ， 初 始 值 为 ]。 

函数 返回 值 为 : 

e dW 为 SxR 的 权 值 调整 矩阵 ; 

。 LS 为 新 的 学 习 状态 。 

此 函数 执行 过 程 中 ， 学 习 速率 的 默认 值 : 


LP.l1r = 0.01 


下 面 举 例 说 明 此 函数 的 应 用 。 应 用 下 面 的 代码 ， 建 立 一 个 随机 输入 向 量 P 和 输出 向 量 
同时 定义 学 习 速率 。 输 入 命令 : 
p = rand(2,1); 


aa = rand(3,1)7 
1p-1r = 0.5; 
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learnh 函数 只 需要 上 面 的 几 个 参数 值 即 可 进行 权 值 调整 的 计算 ， 因 此 可 以 应 用 下 面 的 
语句 来 计算 权 值 调整 的 值 。 


Gw = learnh([l,p,0 ,at 0,0,0,0,lp,D) 
得 到 的 计算 结果 为 : 
Gw = 


0.1599 0.1040 
0.0862 0.0561 
0.1820 0.1183 
此 结果 就 是 应 用 函数 learmh 进行 学 习 所 得 到 的 权 值 的 调整 量 。 
在 网 络 中 应 用 函数 learnh 的 步骤 如 下 。 
全 设置 nettrainFcn 为 trainr 
全 设置 neLadaptFcn 为 trains。 
侠 将 每 个 netinputWeights{i jj.leamFcn 的 值 都 设 为 learnh, 将 每 个 netlayerWeightsfi， 
jj,learnFcn 的 值 都 设 为 learmh。 
全 对 网 络 进行 训练 。 将 nettrainParam 的 属性 设置 为 需要 的 值 。 
人 @@ 调用 train 函数 。 
以 上 就 是 函数 learnh 在 网 络 训练 中 应 用 的 步骤 。 
2. learnhd 
此 函数 为 退化 的 Hebb 权 值 学 习 函数 ， 它 的 学 习 速 率 随 着 时 间 步 长 递减 。 其 调用 格式 
如 下 ; 
[dW.LS] = learmhd(W, P, Z, N,4,T, 尼 ,gW,gA,D,LP LS) 
info = learmhd(code) 
其 中 : 
。 多 为 SxR 的 权 值 矩 阵 ; 
e 王 为 RxO 的 输入 向 量 ; 
。Z 为 SxC 的 加 权 输 入 向 量 ; 
e N 为 SxgC 的 网 络 输入 向 量 ; 
4 为 SxC 的 输出 向 量 ; 
。 了 为 SxC 的 层 目标 向 量 ; 
已 为 Sx@ 的 层 误差 向 量 ; 
egW 为 SxR 的 性 能 相关 梯度 ; 
。gA 为 SxC 的 性 能 相关 输出 梯度 ; 
。 卫 为 SxS 的 神经 元 距离 ; 
。LP 为 学 习 参 数 ; 
。LS 为 学 习 状态 ， 初 始 值 为 ]。 
函数 返回 值 为 : 
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。 dW 为 SxR 的 权 值 调整 矩阵 ; 

。 LS 为 新 的 学 习 状态 。 

此 函数 执行 过 程 中 ， 学 习 速 率 的 默认 值 : 

LP.lLzx=0.01 

退化 速率 : 

LP.dr=0.01 

下 面 对 举 例 说 明 函 数 learnhd 的 应 用 。 应 用 下 面 的 代码 建立 一 个 随机 输入 向 量 P 和 输 
出 向 量 4， 同 时 定义 学 习 速率 和 退化 速率 。 输 入 命令 : 


了 





rand(2,1) 
a = rand(3,1)7 
w = rand(3,2); 
lp.dr = 0.05; 
lp.lr = 0.5; 


learnhd 只 需要 上 面 的 几 个 参数 值 就 可 以 进行 权 值 调 整 的 计算 , 因此 可 以 应 用 下 面 的 语 
句 来 计算 权 值 调整 的 值 。 


aW = learnhd(tw,p,0 ,va 0, 00,0,1p,0) 
得 到 的 计算 结果 为 : 
adW = 


-0.0158 -0.0235 
-0.0151 -0.0132 
0.0718 0.0971 
此 结果 就 是 应 用 函数 learhd 进行 学 习 所 得 到 的 权 值 的 调整 量 。 
在 网 络 中 应 用 函数 learnhd 的 步骤 如 下 。 
全 设置 nettrainFcn 为 trainro 
全 设置 neLadaptFcn 为 trains。 
团 将 每 个 neLinputWeightsti, jj.learmFcn 的 值 都 设 为 leamhd, 将 每 个 netlayerWeights{i, 
jj.leamFcn 的 值 都 设 为 learnhd。 
全 对 网 络 进行 训练 。 将 nettrainParam 的 属性 设置 为 需要 的 值 。 
合 调用 train 函数 。 
以 上 就 是 在 网 络 训练 中 应 用 函数 learmhd 的 步骤 。 
3. learnis 
此 函数 为 内 星 权 值 学 习 函 数 ， 在 此 学 习 规 则 下 ， 权 值 矩 阵 朝 着 输入 向 量 的 方向 变动 。 
其 调用 格式 如 下 : 
[dW.LS] = leamis(W, P, Z, N,4,T, 尼 , gEW, 8A,D,LP LS) 
info = learnis(code) 


其 中 : 
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。 多 为 SxR 的 权 值 矩 阵 ; 

。 忆 为 RxC 的 输入 向 量 ; 

。Z 为 SxC 的 加 权 输 入 向 量 ; 

。 和 为 SxO 的 网 络 输入 向 量 ; 

。 4 为 SxO 的 输出 向 量 ; 

了 为 SxC 的 层 目标 向 量 ; 

。 巨 为 SxO 的 层 误差 向 量 ; 

egW 为 SxR 的 性 能 相关 梯度 ; 

。 8gA 为 SxO 的 性 能 相关 输出 梯度 ; 
。 卫 为 SxS 的 神经 元 距离 ; 

。LP 为 学 习 参 数 ; 

。 LS 为 学 习 状态 ， 初 始 值 为 ]]。 
函数 返回 值 为 ， 

。 dW 为 SxR 的 权 值 调整 矩阵 ; 

。 LS 为 新 的 学 习 状 态 。 

此 函数 的 执行 过 程 中 ， 学 习 速 率 的 默认 值 : 
LP.lIr=0.01 


下 面 是 一 个 函数 leamis 调用 的 简单 例子 。 应 用 下 面 的 代码 建立 一 个 随机 输入 向 量 尸 和 
输出 向 量 4， 同 时 定义 学 习 速 率 。 


P = rand(2,1)7 


a = rand(3,1); 
w = rand(3,2)7 
lp.lr = 0.5; 
应 用 下 面 的 语句 来 计算 权 值 调整 的 值 , 
aW = learnis(w,p, ,va 0 00 0,0,1p,0) 
得 到 的 计算 结果 为 ， 


daw = 
0.0125 ”0.0134 
0.0328 -0.0601 
0.0059 -0.0335 


此 结果 就 是 应 用 函数 learnis 进行 学 习 所 得 到 的 权 值 的 调整 量 。 

在 网 络 中 应 用 函数 leamis 的 步骤 如 下 。 

侠 设置 nettrainFcn 为 trainr。 

全 设置 netadaptFcn 为 tains。 

合 将 每 个 neLinputWeightsfi, jj.learFcn 的 值 都 设 为 jeamis, 将 每 个 netlayerWeights{i, 
jj.learnFcn 的 值 都 设 为 leamis。 

舍 对 网 络 进行 训练 。 将 nettrainParam 的 属性 设置 为 需要 的 值 。 
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全 调用 train 函数 。 
以 上 就 是 在 网 络 训练 中 应 用 函数 leamis 的 步骤 。 





4. learnos 
此 函数 为 外 星 权 值 学 习 函 数 ， 在 此 学 习 规 则 下 ， 权 值 和 矩阵 从 输入 向 量 的 方向 朝 着 输出 
向 量 的 方向 变动 。 其 调用 格式 如 下 : 
[dW'LS] = learos(W, 已,.Z.N,4,T,E,gW,gA,D,LPLS) 
info = learnos(code) 
其 中 : 
e 多 为 SxR 的 权 值 短 阵 ; 
。 忆 为 RxO 的 输入 向 量 ; 
。Z 为 Sx@ 的 加 权 输 入 向 量 ; 
e。 N 为 SxC 的 网 络 输入 向 量 ， 
e。 4 为 SxOC 的 输出 向 量 ; 
。 了 为 Sx@C 的 层 目标 向 量 ; 
。 巨 为 SxO 的 层 误差 向 量 ; 
egW 为 SxR 的 性 能 相关 梯度 ， 
egA 为 Sx@ 的 性 能 相关 输出 梯度 ; 
。 站 为 SxS 的 神经 元 距离 ; 
。 LP 为 学 习 参 数 ; 
e。 LS 为 学 习 状态 ， 初 始 值 为 ]。 
函数 返回 值 为 : 
edW 为 SxR 的 权 值 调整 矩阵 ; 
。 LS 为 新 的 学 习 状 态 ; 
此 函数 执行 过 程 中 ， 学 习 速 率 的 默认 值 : 
LP,.1Iz=0.01 


下 面 是 一 个 函数 learos 调用 的 简单 例子 。 应 用 下 面 的 代码 建立 一 个 随机 输入 向 量 严 
和 输出 向 量 4， 同 时 定义 学 习 速 率 。 
p = rand(2,1)7 
a = rand(3,1)7 


WwW = rand(3,2)7 
1p.1z = 0.5? 


应 用 下 面 的 语句 来 计算 权 值 调整 的 值 : 
aW = learnos(tw,p,U ,Ia,0,0,0,0,0,1p,D) 
得 到 的 计算 结果 为 : 


daW = 
0.0556 ”0.0235 
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0.0294 ”0.1214 

-0.0050 “0.0667 
此 结果 就 是 应 用 函数 leamos 进行 学 习 所 得 到 的 权 值 的 调整 量 。 
在 网 络 中 应 用 函数 learmos 的 步骤 如 下 。 
侠 设置 nettrainFcn 为 tainr。 
命 设置 netadaptFcn 为 rains。 
全 将 每 个 netinputWeights {i, j}.learnFcn 的 值 都 设 为 learnos, 将 每 个 neLlayerWeights{fi, 

jj.learnFcn 的 值 都 设 为 learnos。 

侠 对 网 络 进行 训练 。 将 nettrainParam 的 属性 设置 为 需要 的 值 。 
侠 调用 train 函数 。 
以 上 就 是 在 网 络 训练 中 应 用 函数 leamos 的 步骤 。 


自 定 义 函数 


利用 MATLAB 工具 箱 ， 可 以 自 定 义 生成 很 多 种 类 的 函数 ， 这 为 网 络 的 仿真 、 训 练 等 
带 来 很 大 的 方便 性 和 灵活 性 。 本 节 将 对 这 些 自 定义 函数 进行 详细 的 介绍 。 

根据 其 功能 特点 ， 自 定义 函数 通常 可 以 分 为 网 络 构建 函数 、 初 始 化 函数 、 学 习 函 数 以 
及 自 组 织 映射 函数 四 大 类 ， 它 们 分 别 又 包括 各 自 的 子 类 。 

(1 ) 网 络 构建 函数 

。 传递 函数 。 

。 网 络 输入 函数 。 

。 权 值 函数 。 

(2 ) 初始 化 函数 

网络 初始 化 函数 。 

。 层 初始 化 函数 。 

。 权 值 与 偏差 初始 化 函数 。 

( 3 ) 学 习 函 数 

。 网 络 训练 函数 。 

。 自 适 应 学 习 函 数 。 

。 性 能 函数 。 

。 权 值 和 偏差 学 习 函 数 。 

(4 ) 自 组 织 映 射 函 数 

。 拓扑 函数 。 

。 距离 函数 。 

下 面 各 节 对 上 述 各 种 函数 逐一 进行 介绍 。 


19.3.1 “网络 构建 函数 
网 络 构建 函数 包括 传递 函数 、 网 络 输入 函数 、 权 值 函 数 。 
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1. 传递 函数 

传递 函数 是 根据 给 定 的 网 络 输入 向 量 计算 输出 向 量 的 函数 ， 网 络 输入 向 量 与 输出 向 量 
必须 具有 相同 的 维 数 。 

传递 函数 经 过 定义 之 后 ， 可 以 应 用 在 任意 的 网 络 层 上 。 例 如 自 定义 的 传递 函数 为 
tamplate_transfer， 将 其 应 用 在 网 络 的 第 i 层 上 ， 可 以 通过 下 面 的 语句 实现 : 

net.layer(i).transferFcn = 'template_transfer' 

传递 函数 的 调用 格式 为 : 

4 = template_transfer(N) 

其 中 N 为 SxQ 的 网 络 输入 向 量 。 

函数 返回 值 4 为 网 络 输出 向 量 。 在 应 用 到 网 络 上 之 后 ,生成 的 网 络 就 会 调用 此 传递 函 
数 进 行 计 算 与 仿真 。 

神经 网 络 工具 箱 提 供 了 一 个 示例 自 定 义 函 数 ， 名 为 mytf。 输 入 命令 help mytf 可 以 查 
看 此 函数 的 相关 信息 ;而 输入 命令 type mytf 则 可 以 查看 其 源 文件 。 

如 同一 般 的 MATLAB 函数 源 文件 一 样 ，mytf 函数 源 文件 前 一 部 分 为 函数 说 明 ， 包 括 
函数 自 定义 性 质 、 函 数 调用 格式 、 函 数 信息 格式 ， 以 及 一 个 简单 示例 

第 二 部 分 为 函数 的 具体 实现 , 可 以 看 到 , 当 输 入 为 字符 串 时 ， 函 数 将 输出 自 定义 信息 ; 
而 当 输 入 为 数字 时 ， 函 数 的 结果 由 计算 式 a = 1/(n.^8+1) 确定 。 

可 以 绘 出 此 函数 曲线 ， 在 MATLAB 中 输入 如 下 命令 : 

n = -5:.1:5) 


a = mytftn)7 
plot (n,a) 


绘 出 的 曲线 如 图 19-6 所 示 。 











TREE 
图 19-6 ”mytf 传递 函数 曲线 


可 以 用 函数 mytf 为 模板 来 自 定义 传递 函数 。 
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2 导数 传递 函数 

所 谓 导 数 传递 函数 ， 是 针对 一 个 原 传递 函数 来 说 的 ， 也 就 是 说 ， 导数 传递 函数 就 是 原 
传递 函数 的 导数 。 

对 于 自 定义 传递 函数 mytf， 工 具 箱 提供 了 它 所 对 应 的 导数 传递 函数 mydtf。 输 入 命令 
type mydtf 可 以 查看 其 源 文件 。 

同 mytf 函数 源 文 件 类 似 ，mydtf 函数 源 文件 前 一 部 分 为 函数 说 明 ， 第 二 部 分 为 函数 的 
具体 实现 。 从 源 文件 实现 代码 中 可 以 看 到 , 函数 的 返回 值 由 计算 式 d =-8+n.w7.*aA2 确定 。 

同样 ， 我 们 也 可 以 绘 出 此 导数 传递 函数 的 曲线 。 在 MATLAB 中 输入 如 下 命令 ， 

n = -5:.1:5; 

已 myYtfE(n) 7 

da_dn = mydatfltn,a): 


Subplot(2,1,1)，plot(n,a) 
subplot (2,1,2)，plottn,da_an) 


绘 出 的 曲线 如 图 19-7 所 示 。 




















汪汪 


图 19-7 ”传递 函数 mytf 与 导数 传递 函数 mydtf 曲线 
可 以 用 函数 mydtf 为 模板 来 自 定义 新 的 导数 传递 函数 。 


3. 网 络 输入 函数 

网 络 输入 函数 根据 给 定 的 加 权 输 入 向 量 Z， 计 算得 到 某 层 的 网 络 输入 向 量 N， 网 络 输 
入 向 量 与 加 权 输 入 向 量 必须 具有 相同 的 维 数 。 

网 络 输入 函数 经 过 定义 之 后 ， 可 以 应 用 到 任意 的 网 络 层 上 。 例 如 自 定义 的 网 络 输入 函 
数 为 amplate_netinput， 将 其 应 用 在 网 络 的 第 上 层 上 ， 可 以 通过 下 面 的 语句 实现 : 

net .layer{fi)}.netInputFcn = 'template_netinput'， 

网 络 输入 函数 的 调用 格式 为 : 

N=template_netinput(Z1,Z2...) 

其 中 Z1,Z2.… 为 加 权 输 入 向 量 。 函 数 返 回 值 N 为 网 络 输入 向 量 。 
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神经 网 络 工具 箱 提供 了 网 络 输入 函数 的 自 定义 样本 函数 mynif。 输 入 命令 type mynif 
可 以 查看 其 源 文件 。 

mynif 函数 源 文件 的 前 一 部 分 为 函数 说 明 ， 第 二 部 分 为 函数 的 具体 实现 。 从 源 文件 实 
现代 码 中 可 以 看 到 ，mynif 函数 的 返回 值 ， 也 就 是 自 定义 输 入 向 量 ， 是 由 输入 参数 矩阵 元 
素 倒数 求 和 得 到 的 。 

下 面 举 例 说明 mynif 函数 的 应 用 。 


【 例 19-2】 ”给 定 加 权 输 入 向 量 ， 查 看 mynif 的 运行 结果 。 
解 ; 定义 加 权 输 入 向 量 。 输 入 如 下 命令 : 





zl = rand(4,5)7 
2z2 = rand(4,5)7 
2z3 = rand(4,5) 7 


然后 调用 函数 mynif。 输 入 命令 : 
mn = mynif(zl,z2,z3) 
输出 结果 为 : 


n = 0.1987 0.1190 0.2513 0.1618 0.2061 
0.0315 0.0735 0.1219 0.0335 0.1392 
0.0965 0.1393 0.0878 0.0501 0.2486 
0.2921 0.1688 0.0295 0.0974 0.0290 


也 就 是 计算 得 到 的 网 络 输入 向 量 。 可 以 用 mynif 为 模板 来 自 定义 新 的 网 络 输入 函数 。 
4， 导 数 网 络 输入 函数 

所 谓 导数 网 络 输入 函数 ， 也 是 针对 一 个 原 函数 来 说 的 ， 也 就 是 说 ， 导 数 网 络 输入 函数 
就 是 原 网 络 输入 函数 的 导数 。 

对 于 网 络 输入 函数 mynif， 工 具 箱 提供 了 它 所 对 应 的 导数 网 络 输入 函数 mydnif。 输入 
type mydnif 命令 可 以 查看 其 源 文件 。 

与 前 面 类 似 ，mydnif 函数 源 文 件 前 一 部 分 为 函数 说 明 ， 第 二 部 分 为 函数 的 具体 实现 。 
从 源 文件 实现 代码 中 可 以 看 到 , mydnif 需要 与 mynif 函数 一 起 调用 , mydnif 函数 的 返回 值 ， 
也 就 是 网 络 输入 的 导数 ， 此 导数 是 由 计算 式 d= n^2 .+ z^2 得 到 的 ， 而 其 中 求 导 的 自 变 量 
z 正 是 mynif 的 输入 变量 。 

下 面 举例 说 明 mydnif 函数 的 应 用 。 


【 例 19-3】 ”给 定 加 权 输 入 向 量 ， 查 看 mydnif 的 运行 结果 。 

解 ; 定义 加 权 输 入 向 量 ， 并 调用 函数 mynif 与 mydnif。 输 入 命令 ， 
2z1 = rand(4,5) 7 

z2 = rand(4,5) 

z3 = rand(4,5) 7 

n = mynif(z1l,z2,z3) 

adn_dzl = mydnif(zl,n) 

adn_daz2 = mydnif(z2,mn) 

dn_dz3 = mydnif(z3,mn) 
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Dn = mynif(zl1,z2,z3) 


输出 结果 为 ， 
mn =0.0967 0.1212 
0.1567 0.1612 
0.1450 0.1439 
0.1945 0.0993 
qdn_dazl =0.0053 人 
0.0016 0 

0.0054 0 

0.0185 0 

dn_dz2 =0.0012 0 
0.0169 0 

0.0072 0. 

0.0114 0 

qdn_dz3 =0.0002 0 
0.0155 0 

0.0020 0 

0.0106 0 


0.0928 ”0.1337 “0.1149 
0.1432 ”0.1542 ”0.1405 
0.0603 ”0.1148 ”0.0102 
0.0291 “0.0850 ”0.1363 
0117 0.0002 0.0119 0 
-0239 0.0014 0.0014 0 
.0062 0.0026 0.0114 0 
.0002 0.0001 0.0009 0 
:0124 0.0012 0.0050 0 
-0021 0.0066 0.0144 0. 
0119 0.0000 0.0115 0. 
.0056 0.0000 0.0001 0 
:0004 0.0041 0.0009 0 
“0094 0.0115 0.0198 0. 
.0014 0.0007 0.0003 站 < 
.0042 0.0000 0.0049 0. 
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.0005 
.0012 
-0000 
-0042 
.0043 


0043 
0000 


-0021 
.0038 


0196 
0000 
0036 


其 跨 是 计算 得 到 的 网 络 输入 向 量 ，dn_dz1，dn_dz2，dn_dz3 分 别 是 对 zl、z2、 


23 的 导数 。 


可 以 用 函数 mydnif 为 模板 来 自 定义 新 的 导数 网 络 输入 函数 。 


5， 权 值 函数 


权 值 函数 根据 给 定 的 输入 向 量 PP， 以 及 权 值 矩 阵 克 ， 计算 得 到 一 个 加 权 的 网 络 输入 向 


量 或 矩阵 Z。 


权 值 函数 经 过 定义 之 后 ， 可 以 应 用 到 任意 的 网 络 层 上 。 例如 自 定义 的 网 络 输入 函数 为 
tamplate_netwf， 将 其 应 用 在 网 络 的 第 ; 层 上 ， 可 以 通过 下 面 的 语句 实现 ， 


met . inputWeights{fi).weightFcn = 'template_netwf， 


传递 函数 的 调用 格式 为 ， 
乙 =template_netwf(.P) 


其 中 


。 多 为 网 络 权 值 和 矩阵 ; 
。 忆 为 输入 向 量 矩 阵 。 


函数 返回 值 Z 为 加 权 输 入 向 量 。 


神经 网 络 工具 箱 提供 了 权 值 函数 的 自 定义 样本 函数 mywf。 输 入 type mywf 命令 可 以 


查看 其 源 文件 。 


同样 ，mywf 函数 源 文件 前 一 部 分 为 函数 说 明 ， 第 二 部 分 为 函数 的 具体 实现 。 从 源 文 
件 实现 代码 中 可 以 看 到 ，mywf 返回 值 Z 也 就 是 网 络 的 加 权 输 入 值 ， 此 网 络 加 权 输 入 是 
由 计算 式 Z = W*(P.^2) 得 到 的 ， 其 中 多 和 书 是 函数 的 输入 变量 ， 分 别 是 网 络 权 值 矩阵 


和 输入 向 量 。 
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下 面 举例 说 明 mywf 函数 的 应 用 。 


【 例 19-4】 ”给 定 加 权 输 入 向 量 ， 查 看 函数 mywf 的 执行 结果 。 
解 :定义 随机 输入 向 量 与 权 值 矩 阵 ， 并 调用 函数 mywf。 输 入 命令 ， 
rand(1,5)1 


zanG(5,1) 
myYwfE(w,P) 


输出 结果 为 ， 
z = 0.6636 


即 为 得 到 的 网 络 加 权 输 入 值 。 
可 以 用 mywf 为 模板 来 自 定义 新 的 权 值 函 数 。 


6， 导 数 权 值 函 数 


所 谓 导 数 权 值 函数 ， 是 针对 一 个 原 函数 来 说 的 ， 也 就 是 说 ， 导 数 权 值 函数 就 是 原 权 值 
函数 的 导数 。 


对 于 权 值 函数 mywf, 工具 箱 提供 了 它 所 对 应 的 导数 权 值 函数 mydwfo 输 入 type mydwf 
命令 可 以 查看 其 源 文件 。 

mydwf 函数 与 mywf 函数 的 关系 与 上 面 各 个 导数 函数 与 原 函数 的 关系 一 样 ， 此 处 不 再 
详细 叙述 。 

下 面 举例 说 明 mydwf 函数 的 应 用 。 


【 例 19-5】 ”给 定 加 权 输 入 向 量 ， 查 看 函数 mydwf 的 运行 结果 。 
解 ; 定义 加 权 输 入 向 量 ， 并 调用 函数 mywf 与 mydwf。 输入 命令 : 


randQ(1,5) 7 
rand(5,1) 7 
mYwE(w,P) 
dz_dp = mydwf('p' wp,z) 
dz_dw = mydwf('w' wp,z) 


输出 的 结果 为 : 


z= 0.8401 

az_dp =- 0.1174 1.5832 ”0.2108 ”0.2901 ”0.0422 
dz_dw = 

0.0185 

0.7557 
0.3361 
0 
0 





W 


PP 
志 


W 


P 
2 


和 


.3023 
.0210 


其 中 z 为 加 权 输入 向 量 ，dz_dp、dz_dw 分 别 为 加 权 输 入 向 量 对 于 输入 向 量 和 权 值 向 量 
的 导数 。 
以 mywf 为 模板 可 以 自 定义 新 的 导数 权 值 函数 。 
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19.3.2 ”初始 化 函数 


初始 化 函数 包括 三 类 : 网 络 初始 化 函数 、 层 初始 化 函数 、 权 值 /偏差 初始 化 函数 。 下 面 
分 别 对 其 进行 介绍 。 
1 网 络 初始 化 函数 

网 络 初始 化 函数 将 网 络 所 有 的 权 值 和 偏差 设 定 为 一 个 特定 值 ， 作 为 网 络 的 初始 状态 。 
网 络 初始 化 函数 经 过 定义 之 后 ， 可 以 应 用 到 任意 的 网 络 上 。 例如 自 定义 的 网 络 初始 化 函数 
为 tamplate_nif， 将 其 应 用 在 网 络 net 上 ， 可 以 通过 下 面 的 语句 实现 ， 

ne .initFcn = ,template_nif， 

网 络 初始 化 函数 的 调用 格式 为 : 


net = template_nif(net) 


其 中 net 为 初始 化 网 络 ， 通 常 既 是 函数 输入 ， 同 时 也 设 定 为 返回 值 。 


2. 层 初始 化 函数 

层 初始 化 函数 将 给 定 网 络 某 层 的 所 有 权 值 和 偏差 设 定 为 一 个 特定 值 ， 作 为 训练 的 初始 
状态 。 层 初始 化 函数 经 过 定义 之 后 ， 可 以 应 用 到 网 络 的 任意 层 。 例 如 自 定义 的 网 络 输入 函 
数 为 template_lif， 将 其 应 用 在 网 络 net 的 第 i 层 上 ， 可 以 通过 下 面 的 语句 实现 ， 

net .layers{fi)}.initFcn='ctemplate_lif' 

其 中 ， 

。net 为 初始 化 网 络 ; 

。 ;为 待 初始 化 的 层 。 

层 初始 化 函数 的 调用 格式 为 ， 


net = template_lif(net, 站 


其 中 net 为 初始 化 网 络 ， 通 常 既 是 函数 输入 ， 同 时 也 设 为 返回 值 。 


3， 权 值 /偏差 初始 化 函数 

权 值 /偏差 初始 化 函数 将 给 定 网 络 的 权 值 和 偏差 设 定 为 特定 值 ， 作 为 训练 的 初始 值 。 权 
值 /偏差 初始 化 函数 经 过 定义 之 后 ， 可 以 应 用 到 网 络 的 任意 权 值 和 偏差 上 。 例 如 自 定义 的 网 
络 输入 函数 为 template_wbif， 将 其 应 用 在 网 络 net 的 第 i 层 的 权 值 和 偏差 上 ， 可 以 通过 下 
面 的 语句 实现 ， 


net .biaseti).initFcn='template_wbif' 
net .inputwWeights{il.initFcn='template_wbif' 


其 中 : 

。 net 为 初始 化 网 络 ， 通 常 既 是 函数 输入 ， 同 时 也 设 为 返回 值 ; 

。 ;为 待 初始 化 的 层 。 

对 于 权 值 /偏差 初始 化 函数 ， 工 具 箱 提供 了 一 个 示例 自 定义 函数 mywbif， 该 函数 的 调 
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用 格式 为 





function w = mywbif(s:pr) 
其 中 : 
。 输入 变量 * 为 网 络 神经 元 数目 ， 
。 pr 为 输入 向 量 取 值 范围 。 
函数 返回 值 w 为 网 络 权 值 /偏差 初始 化 值 。 
输入 type mywbif 命令 可 以 查看 mywbif 函数 的 源 文件 。 可 以 看 到 ，mywbif 函数 源 文 
件 前 一 部 分 为 函数 说 明 ， 第 二 部 分 为 函数 的 具体 实现 。 下 面 举例 说 明 其 应 用 。 


【 例 19-6〗 ”对 权 值 /偏差 进行 初始 化 ， 查 看 函数 mywbif 的 运行 结果 。 
解 : 定义 权 值 /偏差 输入 向 量 ， 并 调用 函数 mywbif。 输 入 命令 : 
W = mywbifl4,[0 1; -2 2]) 
b = mywbig(4,[1 1]) 
得 到 的 结果 为 ; 
由 = 
0.0853 ”0.0402 
0.0622 “0.0076 
0.0351 0.0240 
0.0513 ”0.0123 
b =0.0184 
0.0240 
0.0417 
0.0050 
以 上 完成 了 向 量 W 和 的 初始 化 。 
以 mywbif 为 模板 可 以 自 定义 新 的 权 值 /偏差 初始 化 函数 。 


19.3.3 “学习 函数 


MATLAB 工具 箱 中 可 供 自 定 义 的 学 习 函数 包括 四 种 类 型 :训练 函数 自 适应 训练 函数 、 
性 能 函数 ， 以 及 权 值 /偏差 学 习 函 数 。 下 面 对 其 分 别 介绍 。 
1. 训练 函数 

训练 函数 用 来 对 网 络 进行 训练 , 它 将 输入 向 量 循环 应 用 于 网 络 中 ， 从 而 更 新 网 络 的 
权 值 和 偏差 ， 使 其 达到 符合 求解 问题 的 状态 。 训 练 在 达到 最 大 迭代 次 数 或 最 小 梯度 误 
差 、 训 练 精度 时 停止 ， 当 然 以 最 小 梯度 误差 方式 停止 时 ， 有 可 能 是 网 络 落 入 了 局 部 极 
小 点 。 

训练 函数 经 过 定义 之 后 ， 可 以 应 用 到 网 络 上 。 例 如 自 定义 的 训练 函数 为 template_tf， 
要 将 其 应 用 在 网 络 net 的 训练 中 ， 可 以 通过 下 面 的 语句 实现 : 


net .trainFcn='template_cf 
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其 中 net 为 待 训练 的 网 络 。 

训练 函数 的 调用 格式 为 : 

[net ,trj=template_tf(net，Pd，TI，Ai，o，TS，VvV，mV) 

其 中 net 为 初始 化 网 络 ， 既 是 函数 输入 ， 也 是 函数 执行 返回 值 ， tr 为 训练 后 的 网 络 状态 。 
2.， 自 适应 训练 函数 

自 适 应 训练 函数 与 训练 函数 不 同 的 一 点 在 于 ， 自 适应 训练 函数 在 每 个 输入 时 间 段 内 都 
需要 对 网 络 进行 更 新 ， 并 进行 仿真 。 

自 适 应 训练 函数 经 过 定义 之 后 ， 可 以 应 用 到 网 络 上 。 例如 自 定义 的 自 适应 训练 函数 为 
template_atf， 要 将 其 应 用 在 网 络 net 的 训练 上 ， 可 以 通过 下 面 的 语句 实现 ， 


met .adaptFcn='template_atf' 


其 中 net 为 待 训练 的 网 络 。 

自 适 应 训练 函数 的 调用 格式 为 : 

[nettrj=template_atf(net Pd,TL Ai Q,TS) 

其 中 net 为 初始 化 网 络 ， 既 是 函数 输入 ， 也 是 函数 执行 返回 值 ，tr 为 训练 后 的 网 络 
状态 。 


3 性 能 函数 

性 能 函数 用 于 设 定 网 络 训练 时 期 望 达到 最 优 的 函数 指标 。 性 能 函数 经 过 定义 之 后 ， 可 
以 应 用 到 网 络 上 。 例 如 自 定义 的 性 能 函数 为 template_performf， 要 将 其 应 用 在 网 络 net 的 
训练 上 ， 可 以 通过 下 面 的 语句 实现 ， 

net ,performFcn='template_performf' 

其 中 net 为 待 训练 的 网 络 。 此 后 ， 任 何 时 候 对 网 络 进行 训练 和 调整 的 时 候 ， 都 将 采用 
此 函数 作为 最 优化 的 性 能 指标 。 

函数 执行 时 需要 提供 性 能 参数 ， 获 取 默 认 参 数 的 格式 如 下 ， 

LP = template_performf ('pdefaults') 

自 定义 性 能 函数 的 调用 格式 为 : 

perf=template_performf(E, XX, PP) 

其 中 : 

。 巨 为 期 望 值 矩阵 ; 

。 XX 为 网 络 权 值 和 偏差 矩阵 ; 

。 PP 为 网 络 参数 。 

如 果 巨 是 一 个 cell 数组 ， 则 必须 转换 为 矩阵 形式 : 

BE=cell2mat (E) 


MATLAB 神经 网 络 工具 箱 提供 了 一 个 示例 自 定义 函数 mypf。 输 入 type mypf 命令 可 
以 查看 其 源 文件 。 有 兴趣 的 读者 可 以 自行 输入 命令 查看 。 
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下 面 举例 说 明 mypf 函数 的 应 用 。 


【 例 19-7】 ” 设 定 随机 期 望 和 权 值 偏差 ， 查 看 函数 mypf 的 运行 结果 。 
解 ， 定义 期 望 和 权 值 偏差 矩阵 ， 并 调用 函数 mypf。 输 入 命令 : 


e 





ranQ(4,5) 7 

习 rand(12,1) 7 

pP = mypf('pdefaults') 
perf = mypf(e,x,pP) 


得 到 的 结果 为 : 
pp = x: 1 


y: 0.5000 
perf = 0.7066 


可 以 用 函数 mypf 为 模板 来 自 定义 新 的 性 能 函数 。 
4， 权 值 /偏差 学 习 函 数 

权 值 /偏差 学 习 函数 是 一 种 比较 特殊 的 学 习 函数 ， 它 需要 和 某 些 训练 函数 一 起 使 用 ， 才 
能 在 学 习 中 实现 对 单独 权 值 和 偏差 的 更 新 。 

权 值 /偏差 学 习 函 数 经 过 定义 之 后 ， 可 以 应 用 到 网 络 上 。 例如 自 定义 的 权 值 /偏差 学 习 
函数 为 template_wblf， 要 将 其 应 用 在 网 络 net 第 层 偏 差 的 训练 中 ， 可 以 通过 下 面 的 语句 
实现 ， 

net .biases{i) .learnFcn='cemplate_wblf' 

其 中 net 为 待 训练 的 网 络 。 此 后 ， 任 何 时候 对 网 络 进行 训练 和 调整 的 时 候 ， 都 将 采用 
此 函数 作为 最 优化 的 性 能 指标 。 

函数 执行 时 需要 提供 学 习 函 数 参数 ， 获 取 默 认 参数 的 格式 如 下 : 

LP -= template_wblf ('pdefaults') 


: 权 值 /偏差 学 习 函 数 的 调用 格式 为 : 


fdb, LS]-template_wblf(W, P, Z, N,A,T, 已 , gW, gA,D,LP LS) 
其 中 ， 

。 几 为 SxR 的 权 值 矩 阵 ; 

。 忆 为 RxC 的 输入 向 量 ; 

。Z 为 SxO 的 加 权 输 入 向 量 ; 

se N 为 SxOC 的 网 络 输入 向 量 ; 

。 4 为 SxO 的 输出 向 量 ; 

e。T 为 SxO 的 层 目标 向 量 ; 

e。 巨 为 SxO 的 层 误差 向 量 ; 

egW 为 SxR 的 性 能 相关 梯度 ; 
。gA 为 SxO 的 性 能 相关 输出 梯度 ; 
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。 万 为 SxS 的 神经 元 距离 ; 

。LP 为 学 习 参 数 ; 

。 LS 为 学 习 状态 ， 初 始 值 为 ]。 

函数 的 返回 值 中 : 

。 db 为 SxR 的 权 值 偏差 调整 矩阵 ; 

。 LS 为 新 的 学 习 状态 。 

对 于 权 值 /偏差 学 习 函 数 ,工具 箱 提供 了 一 个 示例 自 定义 函数 mywblf。 输 入 type mywblf 
命令 可 以 查看 其 源 文件 ， 其 源 程序 不 再 详细 列 出 ， 有 兴趣 的 读者 可 以 自行 查看 。 

下 面 举 例 说 明 mywblf 函数 的 应 用 。 


【 例 19-8】 设 定 随机 期 望 和 权 值 偏差 ， 查 看 函数 mywblf 的 运行 结果 。 
解 : 定义 随机 权 值 矩 阵 、 性 能 相关 梯度 等 。 输 入 命令 : 


由 = rand(4,5) 7 
gwW = rand(4,5)7 


然后 获取 默认 参数 。 输 入 命令 ， 

lp -= mywblft('pdefaults') 

输出 结果 为 : 

lp = 1lr: 0.0100 

调用 mywblf 函数 ， 计 算 更 新 值 。 输 入 命令 : 


[aw,1s] = mywblftw,0 ,0 ,0 0 ,00,gw,0 ,lp 0)， 
见 =W+dw， 

gW = rand(4,5) 7 

[aw,ls] = mywblftw, ,0 ,0 ,0,0 0,gw,r ,lp,ls); 
W = 由 +dw， 

输出 结果 为 : 


W =0.9292 0.2377 0.5226 0.6818 0.0378 
0.7311 0.4610 0.2339 0.3965 ”0.8874 
0.4896 ”0.9634 ”0.4910 0.3695 ”0.9148 
0.5806 0.5488 0.6268 0.9886 0.7976 

W =0.9355 “0.2433 ”0.5288 ”0.6887 ”0.0382 
0.7354 0.4650 0.2341 0.4015 0.8922 
0.4939 0.9647 “0.4945 ”0.3730 “0.9151 
0.5866 ”0.5504 ”0.6279 “0.9919 “0.7981 


以 mywblf 为 模板 可 以 自 定义 新 的 权 值 /偏差 初始 化 函数 。 


19.3.4 _” 自 组 织 映射 函数 


MATLAB 工具 箱 中 可 供 自 定 义 的 自 组 织 映射 函数 包括 两 种 : 拓扑 函数 和 距离 函数 。 下 
面 对 其 分 别 介绍 。 
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1， 拓扑 函数 

拓扑 函数 用 在 自 组 织 映 射 网 络 中 , 用 来 计算 神经 元 的 位 置 。 拓扑 函数 在 经 过 定义 之 后 ， 
可 以 应 用 到 网 络 的 任意 一 层 。 例 如 自 定 义 的 拓扑 函数 为 template_topf， 要 将 其 应 用 在 网 络 
net 第 层 上 ， 可 以 通过 下 面 的 语句 实现 

net .layers{i] .topologyFcn='template_topf' 


拓扑 函数 的 用 途 是 从 维 数 dim 计算 出 神经 元 位 置 ， 其 调用 格式 为 : 


pos = template_topftdiml, dim2, .… ,dimN) 
其 中 ， 返 回 值 pos 是 神经 元 的 位 置 。 
对 于 拓扑 函数 , MATLAB 工具 箱 提 供 了 一 个 示例 自 定义 函数 mytopf。 输入 type mytopf 
命令 可 以 查看 其 源 文 件 。 函 数 源 程序 不 再 详细 列 出 , 有 兴趣 的 读者 可 以 自行 输入 命令 查看 。 
下 面 举 例 说 明 mytopf 函数 的 应 用 。 
【 例 19-9】 ”定义 一 个 20x20 的 网 络 层 ， 查 看 函数 mytopf 的 运行 结果 。 
解 : 输入 命令 : 


pos = mytopf(20,20); 
plotsom(pos) 


输出 的 结果 如 图 19-8 所 示 。 
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图 19-8 20x20 网 络 层 拓扑 结构 
以 函数 mytopf 为 模板 可 以 自 定义 新 的 拓扑 函数 。 


2.， 距离 函数 

距离 函数 应 用 在 自 组 织 映射 网 络 中 ， 用 于 在 给 定位 置 的 条 件 下 ， 计算 某 一 层 神经 元 之 
间 的 距离 。 

距离 函数 在 经 过 定义 之 后 ， 可 以 应 用 到 网 络 的 任意 一 层 。 例如 自 定义 的 距离 函数 为 
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template_distf， 要 将 其 应 用 在 网 络 net 第 i 层 ， 可 以 通过 下 面 的 语句 实现 ， 


ne .layersti).distanceFcn='cemplate_aistf， 


距离 函数 的 用 途 是 从 位 置 pos 计算 出 神经 元 间 的 距离 ， 其 调用 格式 为 ， 


d= template_distftpos1l, pos2,.. ;posN) 
其 中 ， 返 回 值 4 是 神经 元 的 距离 。 
对 于 距离 函数 ,MATLAB 工具 箱 提供 了 一 个 示例 自 定义 函数 mydistfo 输 入 type mydistf 
命令 可 以 查看 其 源 文件 。 函 数 源 程序 不 再 详细 列 出 ， 有 兴趣 的 读者 可 以 自行 输入 命令 查看 。 
下 面 对 mydistf 函数 的 应 用 进行 举例 说 明 。 
【 例 19-10】 定义 一 个 网 络 拓扑 结构 ， 查 看 函数 mydistf 的 运 
解 ， 输入 命令 ， 


pos = gridtop(3,2) 7 
q = mydistf(pos) 





结果 。 


输出 的 结果 为 : 

可 二 0 1.0000 2.0000 1.0000 1.5874 2.4473 
1.0000 0 1.0000 1.5874 1.0000 1.5874 
2.0000 1.0000 0 2.4473 1.5874 1.0000 
1.0000 1.5874 2.4473 0 1.0000 2.0000 
1.5874 1.0000 1.5874 1.0000 0 1.0000 
2.4473 1.5874 1.0000 2.0000 1.0000 0 


返回 结果 为 上 面 定义 的 网 络 拓扑 层 的 距离 矩阵 。 
以 mydistf 为 模板 可 以 自 定义 新 的 距离 函数 。 


本 章 讲述 了 MATLAB 神经 网 络 工具 箱 中 一 些 用 于 自 定义 神经 网 络 的 函数 ， 并 通过 实 
例 讲 述 了 这 些 函 数 的 应 用 。 熟 练 掌握 自 定义 神经 网 络 函数 ， 有 助 于 拓展 MATLAB 神经 网 
络 的 应 用 。 
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附录 内 ”工具 箱 函数 列表 

















1 分析 函 数 
务 数 名 说 明 
emrsurf 神经 元 误差 面 
confusion 上 人生 阵 分 类 
maxlinlr 线性 神经 元 最 大 学 习 速率 
roc 接收 机 运行 特性 





2.， 距离 函数 








boxdist 两 个 位 置 向 量 之 间 的 距 均 
dist 欧 氏 距离 
Tinkdist Link 距离 











mandist Manhattan 距离 





3， 图 形 界面 函数 
































神经 网 络 分 类 工具 
神经 网 络 拟 合 工具 
打开 Network/Manager 窗口 

nntraintool 神经 网 络 训练 工具 
神经 网 络 模式 识别 工具 
查看 神经 网 络 

4， 层 初始 函数 
函数 名 说 明 
initnw Nguycn-Wdrow 层 初 始 函 数 
initwb 权 值 偏差 层 初始 函数 








Consience 偏差 学 习 函数 





梯度 下 降 学 习 函数 
带动 量 的 梯度 下 降 学 习 函数 
Hebb 权重 学 习 函 数 




















附录 人 ”工具 箱 函数 列表 






































续 表 

函数 名 
leamhd 退化 的 Hebb 学 习 函 数 
ieamis 内 星 学 习 函数 
ieamk Kohonen 权重 学 习 函数 
leamlv1l LVQI 权重 学 习 函 数 
leamlv2 LVQ2 权重 学 习 函数 
ieamos 外 星 学 习 函数 
ieamp 感知 器 学 习 函数 
Ieampn | 归 一 化 感知 器 学 习 函 数 
leamsom 自 组 织 观 射 权 值 学 习 函 至 
lcamsomb 批 处 理 自给 织 映射 学 习 函 数 








leamwh 





6 线 搜索 函数 


Widrow-Hoff 学 习 函 数 





函数 名 


二 一 












回 退 搜索 一 维 最 小 化 








Brent 一 维 间 距 定位 








srchcha 


Charalambous 一 维 最 小 化 








srchgol 


黄金 分 齐 一 维 最 小 化 














rsrchhyb 








二 元 /三 元 综合 搜索 的 一 维 最 小 化 



























































7， 网 络 输入 函数 
函数 名 
netprod 网 络 输入 求 
metsum 网 络 输 入 求 和 
8 网络 初 始 化 函数 
函数 名 
ay 逐 层 网 络 初始 化 
9 网络 应 用 函数 
函数 名 
adapt 允许 网 络 自 适 应 调节 
disp 示 网 络 属性 
display 显示 网 络 变量 名 称 和 属性 
init 初始 化 网 络 
sim 网 络 仿真 
train 训练 网 络 
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10， 网 络 创建 函数 






































































































































函数 名 说 明 
network 自 定义 网 络 
newe 创建 一 个 竞争 层 网 络 
newef | aa 嫂 - 个 B 了 和风 
newdudmm 创建 一 个 时 间 分 布 延迟 网 络 
newelm 创建 一 个 ElIman 网 络 
[E2 | 创建 一 个 BP 网 络 
newfRd 创建 一 个 前 向 输入 延迟 BP 网 络 
newfit 创建 一 个 Fiting 网 络 
mewgrnn 创建 一 个 GRNN 网 络 
mewhop 创建 一 个 Hopfield 网 络 
newlin 创建 一 个 线性 网 络 
newlind 创建 一 个 线性 层 
aewim 创建 一 个 层 反馈 网 络 
newlvq 创建 一 个 LVQ 网 络 
mewnanx | 创建 一 个 输出 到 输入 有 反馈 的 BP 网 络 
newnarxsp 创建 一 个 NARX 网 络 
ER | 证 一 个 号 和 吕 神 经 元 了 | 
newpnn 创建 一 个 慨 率 神经 网 络 
newpr 创建 一 个 模式 识别 网 络 
newtb 创建 一 个 径 向 基 网 络 
newrbe 精确 创建 一 个 径 向 基 网 络 
创建 一 个 自给 织 映 射 网 络 
创建 一 个 序列 并 行 NARX 网 络 
函数 名 说 明 
ae | 平 的 绝对 误差 性 能 函数 
me 均 方 误差 性 能 函数 
msereg 艾 方 误差 Regularization 性 能 函数 
mseregec 均 方 误差 RegularizatioEconomization 性 能 函数 
se 误差 平方 和 性 能 函数 
12. 绘图 函数 
函数 名 | 说 “ 明 
hintonw 权 值 短 阵 Hinton 图 
hintonwb 权 值 年 阵 和 偏差 向 量 Hinton 图 











plotbr 
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绽 制 应 用 矶 叶 斯 规则 训练 的 网 络 
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续 表 
开 函数 名 说 明 
plotconfusion 绘制 分 类 混合 矩 阵 
plotep 给 制 误差 曲面 上 的 权 值 含 差 位 置 
plotes 绘制 单 输入 神经 元 的 误差 曲面 
plotfit 绘制 函数 拟 合 曲线 
[ee 绘制 感知 器 向 量 图 上 的 分 界线 
plotperf 给 制 网 络 性 能 旺 线 
plotperform 绽 制 网 络 性 能 曲面 
plotpy 绘制 感知 器 输入 目标 向 量 
plotregression 绽 制 线性 回归 
plotroc | 绽 制 接收 器 运行 特性 
plowsom 绘制 自给 织 映射 
plosomhits 绘制 自 组 织 映 射 样本 命中 ] 
plotsomne 绘制 自 组 织 映射 相信 连接 
plowomnd 绽 制 自 组 织 映射 相 邹 距离 
plotwompos 绘制 自 组 织 映 射 权 值 位 置 
plosomtop 绽 制 自 组 织 映 射 拓扑 
plottrainstate 绘制 训练 状态 
plotv 综 制 向 量 
plotv 绽 制 不 同 颜 色 
postreg 网 络 后 处 理 
13. 处 理 函 数 





函数 名 


























14， Simulink 支持 函数 


fixunknowns 标记 向 量 中 含 未 知 值 的 行 
此 将 向 量 行 最 大 和 最 小 值 映射 到 [-1 1 
mapstd 将 向 量 每 行 均值 映射 为 0 方差 为 1 
processpca 对 每 列 进行 主 成 分 分 析 

removeconstantrows 删除 党 数列 
removerows 删除 特定 行 
































函数 名 说 明 
emsim 生成 Simulink 模块 
15， 拓扑 函 数 
函数 名 说 明 悦 | 
Endop 短 形 拓扑 函数 
extop 六 角形 拓扑 函数 
andtop 随机 拓扑 函数 | 
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16. 训练 函数 
函数 名 说 有 明 
芭 权 值 偏 关 批 处 理 训练 
trainbfeg 拟 牛 顿 BP 训 
bfee 参考 白 适 应 控制 器 拟 牛顿 BP 训练 
ainbr | 页 叶 类 标准 化 训练 
ainbuwb 批 处 理 非 监督 权 值 含 半 训练 
Wine 循环 着 增 修正 训练 








maincgb 





Powell-Beale 共 饮 梯度 的 BP 训练 算法 








raincBf 





Fletcher-Poweil 共 重 梯度 的 BP 训练 算法 















































traincgp Polak-Ribiere 共 重 梯度 的 BP 训练 算法 
maingd 梯度 下 降 算法 

traingda 自 适应 学 习 速 率 梯度 下 降 算法 
traingdm 带动 重 的 梯度 下 降 算法 

traingdx 带动 量 的 自 适应 学 习 速 率 梯度 下 路: 
rainlm Levenberg-Marquartdt BP 训练 算法 








trainoss 






一 步 正 齐 BP 算法 








trainr 


随即 依次 递增 修正 训练 算法 








trainrp 





可 复位 的 BP 训练 算法 








tmains 





5 





顺序 依次 着 增 训练 算法 





trainscg 


17， 传递 函数 









量化 连续 梯度 BP 训练 算法 






























































compet | 竟 委 传闻 函 数 

hardlim 硬 限 值 传递 函数 

hardlims 对 称 硬 限 值 传递 函数 

logsig logsig 传递 函数 

netinv 反 向 传递 函数 

Postin 正 线性 传递 函数 

purelin | 线性 传递 函数 

adbas 径 向 基 传递 函数 

satlin 饱和 线性 传递 函数 

auins 对 称 饱和 线性 传递 函数 

oftmax 软 最 大 值 传递 函 数 

ansig uansig 传递 函数 

tibas 角 径 向 基 传递 孟 数 

18. 有 效 函 数 
说 

用 单个 向 量 计算 权 值 和 偏差 性 能 梯度 
计算 复 克 比 性 能 向 量 
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续 表 
函数 名 说 明 
calcjx 用 单个 向 量 计算 权 值 和 偏差 性 能 梯度 
calcpd 计算 延 时 网 络 输入 
calcperf 计算 网 络 输 出 、 信 号 和 性 能 | 
etx 用 单 量 获 孙 所 有 网 络 权 值 和 偏差 




















量 设置 所 有 网 络 权 值 和 偏差 









combvec 











创建 所 有 





组 合 









































con2seq 将 并 行 向 量 转 为 序列 向 时 
concur 创建 并 行 偏差 向 量 
ind2vec 将 标量 转换 为 向 量 
minmax 短 阵 行 向 量 的 范围 











矩阵 列 向 量 的 归 一 化 








和 矩 阵 行 向 量 的 归 一 化 






































20.， 权 值 偏差 初始 函数 


pnormec | 短 阵 列 向 量 的 执 归 化 
uant 将 数值 离 艇 为 数量 积 
Seq2con | 将 序列 向 量 转 为 并 行 向 量 
YVec2ind 将 向 量 转 为 序号 











initcon 


Conscience 偏差 初始 函数 





initsompe 


SOM 权 值 主 成 分 初始 化 





initzero 


零 权 值 偏差 初始 函数 





midpoint 


中 值 初始 函数 





randnc 


归 一 化 列 权 值 初始 函数 





randnr 


归 一 化 行 权 值 初始 函数 





rands 


对 称 随机 权 值 含 壮 初 始 函数 





改变 网 络 权 值 偏差 至 前 一 次 的 初始 化 函数 









































21， 权 值 函 数 
函数 名 说 “ 明 
convwf 卷 积 权 值 函数 
dist 欧 氏 距离 权 值 函数 
dotprod 值 函 数 
mandist Manhattan 距离 权 值 函 数 
negdist 负 距离 权 值 函数 
normprod 归 一 化 点 积 权 值 函数 
[salprod | 标量 积 权 值 函数 
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